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PREFACE 


L'ouvrage  dont  la  publication  commence  avec  le  présent 
volume  est  le  développement  d'un  «  précis  »  écrit  il  y  a 
une  douzaine  d'années.  Il  comprend  la  matière  des  leçons 
professées  par  l'auteur  à  l'Université  de  Louvain  d'abord, 
àl' Institut  supérieur  de  commerce  d'Anvers  ensuite,et  vivi- 
fiées par  les  réflexions  de  l' administrateur  qui  a  appliqué 
les  principes  dont  il  élargit  aujourd'hui  l'exposé.  Mûri  au 
milieu  des  dures  épreuves  de  la  guerre,  dans  un  pays  en- 
vahi, le  premier  volume  paraît  au  moment  où  la  nécessité 
de  reconstituer  les  Etats  politiques,  de  stimuler  les  forces 
économiques  et  les  rouages  sociaux  de  ces  Etats,  rend  plus 
utile  que  jamais  l'observation  précise  et  méthodique  ries 
collectivités. 

Exercé  depuis  longtemps  aux  enquêtes  et  à  l'étude  mo- 
nographique des  faits  sociaux,  M.  Julin  ne  sacrifie  point 
la  description  analytique  des  faits  au  besoin  de  synthèse, 
mais  il  arme  cette  synthèse  de  l'appareil  mathématique 
qui  en  assure  la  solidité,  sans  d'ailleurs  aller  au  delà  de 
l'indispensable.  Dans  le  présent  volume,  l'étudiant  trou- 
vera un  exposé  simple  de  méthodes  aujourd'hui  classiques, 
illustré  par  de  nombreuses  applications  numériques  qui 
rendent  sensibles  l'enchaînement  et  la  portée  de  ces  théo- 
ries. Les  deux  autres  volumes  se  rapporteront,  l'un  à  la  sta- 
tistique économique,  l'autre  à  la  statistique  du  travail. 
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Les  trois  parties  de  ce  premier  volume  renferment,  la 
première  un  aperçu  des  caractères  généraux  de  la  statis- 
tique, la  seconde  l'exposé  des  procédés  communément  em- 
ployés pour  le  récolement  des  données  numériques  que  la 
statistique  met  en  œuvre,  la  troisième  l'indication  de  la 
méthode  qui  préside  à  cette  mise  en  œuvre. 

La  dernière  partie  est  celle  qui  assigne  à  la  statistique 
sa  valeur  propre  :  les  matériaux  ne  servent  réellement  que 
lorsque  la  construction  est  achevée;  la  construction  n'est 
solide  que  si  ses  parties  sont  convenable  tuent  ordonnées  et 
ajustées  avec  une  certaine  précision.  Le  langage  mathé- 
matique facilite  singulièrement  l'exposition  des  règles  qui 
permettent  d'atteindre  ce  résultat;  l'auteur  l'emploie  avec 
sobriété,  cherchant  surtout  à  faire  saisir  par  des  exemples 
le  mécanisme  et  l'application  des  formules. 

Les  principes  qui  interviennent  dans  le  traitement  des 
observai  ions  statistiques  ne  diffèrent  pas  de  ceux  que  l'on 
applique  dans  les  sciences  de  la  nature,  toutes  les  fois  que 
l'on  recherche  une  certaine  précision  en  vue  de  serrer  la 
réalité  de  plus  près.  Toute  science  ne  se  réduit-elle  pas  à 
un  système  dans  lequel  on  fait  état  d'analogies  ou  de  res- 
semblances, et  de  différences  ou  de  dissemblances,  pour  for- 
mer des  catégories  uniformes  et  faciliter  le  travail  de  la 
pensée?  Moins  ces  catégories  sont  nombreuses,  plus  la 
pensée  évolue  avec  aisance;  par  contre  plus  elle  s'éloigne 
de.  la  réalité,  plus  elle  perd  l'acuité  qui  lui  faisait  embras- 
ser, d'une  façon  plus  ou  moins  confuse,  les  nuances  infi- 
nies des  qualités  des  choses.  Les  expériences  célèbres  de 
Begnault  ont  provoqué  l'indignation  de  certains  savants  : 
elles  ont  pourtan  t  préparé  des  progrès  considérables  ;  par 
contre,  aucune  collection  de  mesures,  si  nombreuses  soient- 
elles,  ne  nous  donne  une  image  des  mouvements  de  la  mer 
aussi  exacte  que  la  vue  directe,  réfléchie  par  la  pensée,  ou 
que.  l'audition  du  poème  symphonique  qui  nous  place  dans 
le  même  état  d'âme. 


l'HÉFACK 


I  \ 


Mais  le  développement  de  la  science  exige  des  efforts  : 
ceux  auxquels  la  pensée  est  condamnée  par  la  multiplica- 
tion de  catégories  qui  sont  de  plus  en  plus-  étroitement  dé- 
limitées, grâce  à  la  précision  avec  laquelle  on  note  les  res- 
semblances et  les  différences.  Accroître  cette  précision, 
c'est  permettre  à  la  science  de  tendre  vers  la  finesse  de  la 
perception  confuse  tout  en  conservant  la  clarté,  la  fixité, 
l'uniformité  des  notions  conventionnelles.  Parfois  d'ail- 
leurs cette  précision  fait  apparaître  des  analogies  insoup- 
çonnées et  merveilleusement  fécondes,  quand  des  mesures 
équivalentes  se  rapportent  à  des  phénomènes  qui  semblaient 
d'essence  très  différente. 

Dans  tous  les  cas,  la  précision  croissante  des  mesures 
indique  avec  évidence  que  l'uniformité  complète  n'existe 
que  dans  les  notions  conventionnelles.  On  saisit  mieux 
alors  la  nécessité  pratique  d'une  règle  telle  que  celle  de  la 
moyenne  et  des  lois  qui  résultent  d'interpolations. 

La  notion  de  précision  est  d'ailleurs  toute  relative,  ca- 
riant avec  le  progrès  des  instruments.  Dans  les  sciences  de 
la  nature  inanimée,  où  le  degré  de  précision  dont  on  se  con- 
tentait il  y  a  un  siècle  a  été  centuplé,  on  est  à  même  de  pré- 
voir certains  événements  avec  une  extrême  rigueur.  Dans 
tes  sciences  de  la  vie,  dans  les  sciences  sociales  surtout, 
où  les  choses  se  mesurent  à  l'échelle  de  l'homme  et  non  à 
l'échelle  des  éléments  de  la  matière,  on  se  contente  d'ap- 
proximations relativement  larges,  suffisantes  pour  la  vie 
pratique. 

Ce  n'est  pas  seulement  pour  prévoir,  c'est  aussi  pour 
raisonner  juste  qu'une  certaine  précision  est  nécessaire,  car 
les  notions  issues  de  la  réalité  n'en  épousent  pas  exacte- 
ment la  forme:  il  importe  de  limiter  la  déformation  par  un 
critérium  universellement  adopté. 

De  là  l'utilité  du  langage  mathématique,  —  qui  d'ailleurs 
peut  souvent  être  réduit  à  des  expressions  simples  — ,  tontes 
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les  fois  que  l'on  raisonne  sur  dès  grandeurs,  même  quand 
ces  grandeurs  se  rapportent  à  la  vie  de  l'homme  en  société. 

Il  importe  seulement  de  ne  point  oublier  que  l'étude  nu- 
mérique, de  même  que  l'étude  analytique,  des  faits  obser- 
vés ne  peut  donner  plus  que  le  contenu  de  ces  faits.  Aussi 
convient-il  de  passer  les  observations  au  crible  d'une  cri- 
tique attentive.  «  Le  développement  de  la  critique,  re- 
marque M.  Julin,  a  toujours  marché  de  pair  avec  l'esprit 
scientifique.  »  On  pourrait  dire  encore  que  l'esprit  cri- 
tique est  la  première  condition  de  l'esprit  scientifique: 
on  ne  construit  bien  que  si  l'on  est  à  même  d'apprécier  la 
valeur  des  matériaux.  Le  véritable  idéal  du  statisticien  est 
l'application  de  l'esprit  scientifique  à  la  mise  en  œuvre 
des  observations  numériques.  Imprégné  de  cet  idéal,  le  sta- 
tisticien ne  s'embarrassera  guère  de  la  question  de  savoir 
si  la  statistique  est  une  méthode,  une  science,  un  groupe 
de  sciences  ou  un  art,  ou  bien  si  la  statistique  peut  légiti- 
mement intervenir  dans  de  nombreux  ordres  de  connais- 
sances, si  au  contraire  elle  doit  limiter  son  domamc  à  la 
mesure  des  phénomènes  sociaux. 

Les  controverses  à  propos  de  classification  naissent  gé- 
néralement d'un  certain  désaccord,  sur  les  limites  assignées 
aux  catégories  dont  on  discute.  On  pourrait  aussi  se  de- 
mander si  la  géométrie  est  une  méthode  ou  une  science; 
on  pourrait  comparer  l'unité  de  la  physique  d'Aristote  à 
l'unité  d'une  discipline  particulière  telle  que  la  morpholo- 
gie des  plantes,  la  géochimie  ou  la  mécanique  statistique. 
Il  importe  moins  de  savoir  si  l'étude  à  laquelle  on  con- 
sacre son  activité  est  ou  non  une  science,  que  de  poursui- 
vre cette  étude  avec  un  état  d'esprit  scientifique,  car  c'est 
le  seul  moyen  de  déterminer  l'acceptation  universelle  des 
résultats. 

La  nécessité  de  n'aborder  les  recherches  statistiques 
qu'avec  cet  état  d'esprit  est  surtout  évidente  quand 
il  s'agit  de  statistiques  internationales  où  se  heurtent 
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souvent  des  tendances  respectables  mais  opposées.  Que 
de  sécurité  dans  l'état  économique  des  peuples,  dans 
leurs  relations  permanentes,  si  l'on  connaissait  à  tout 
moment,  avec  quelque  précision,  d'une  part  l'état  des 
ressources  en  produits  consommables,  quantités  pro- 
duites et  stocks,  en  rapport  avec  les  besoins  de  la 
consommation,  d'autre  part  la  puissance  des  moyens 
de  production  et  des  éléments  de  progrès  dans  cha- 
cun d'eux*.  Mais  ce.  ne  sont  point  des  données  qu'il  soit  pos- 
sible de  grouper  incontinent  par  la  vertu  magique  d'une 
ci/quête  accidentelle.  Il  faut  une  observation  patiente  et  de 
longue  durée  pour  que  la  documentation  statistique,  arri- 
vant, par  des  milliers  de  canaux,  des  principaux  points  du 
globe,  se  résume  en  une  matière  clarifiée  et  de  bon  aloi. 

De  même  que  les  langues  diffèrent  d'une  contrée  à 
l'autre,  souvent  d'une  région  à  l'autre  d'un  même  pays, 
le  sens  et  la  compréhension  des  termes  qui  servent  à  dé- 
signer les  catégories,  dans  les  tableaux  statistiques,  varient 
suivant  les  pays,  suivant  les  régions. 

C'est  ainsi  que  dans  les  comparaisons  internationales, 
les  rubriques  qui  caractérisent  les  âges  des  individus, 
les  enfants  nés  vivants  ou  morts,  les  religions,  les  crimes 
et  délits,  les  degrés  d'instruction,  les  professions  exer- 
cées, les  grèves,  les  marchandises  échangées,  les  unités 
de  transport,  les  qualifications  d'origine,  la  circula- 
tion fiduciaire,  les  charges  financières  publiques,  etc., 
comportent  souvent  des  acceptions  différentes;  les 
chiffres  correspondant  à  une  même  rubrique  s'appli- 
quent à  des  choses  qui  -ne  sont  point  les  mêmes.  La 
principale  tâche  des  organismes  internationaux  tels 
que  l'Institut  international  de  statistique  est  d'obtenir  une 
plus  grande  uniformité,  de  tendre  vers  l'unité  des  relevés, 
des  cadres  et  des  notations  statistiques.  Mais  les  difficul- 
tés sont  grandes;  de  longs  et  patients  efforts  sont  néces- 
saires; longtemps  encore  on  ne  pourra  légitimer,  sur  beau- 
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coup  de  points,  les  comparaisons  internationales  qu'en  les 
accompagnant  de  commentaires  détaillés  c'est-à-dire  d'un 
examen  critique  attentif  des  résultats  comparés. 

On  ne  saurait  d'ailleurs  renoncer  à  ces  comparaisons, 
sous  le  prétexte  qu'elles  sont  incertaines  et  dangereuses. 
Si  la  vie  internationale  peut  comporter  un  foyer  de  lu- 
mières communes,  un  centre  de  relations  permanentes,  il 
importe  que  la  précision  et  la  rapidité  des  informations 
sur  tout  ce  qui  intéresse  l'existence  des  peuples,  s'amé- 
liorent sans  cesse.  Seule  la  pratique  de  ces  informations 
peut  apprendre  dans  quel  sens  et  par  quels  moyens  doit  se 
réaliser  le  mieux.  On  n'aperçoit  en  effet  l'insuffisance  des 
relevés  numériques  que  lorsqu'on  en  analyse  les  éléments, 
que  l'on  sonde  les  différences  constatées.  Il  ne  faut  point 
sans  cesse  fuir  le  danger,  puisqu'il  naît  de  l'intensité  de 
la  vie;  il  impolie  seulement  d'y  parer. 

Loin  de  proscrire  les  rapprochements  douteux,  il  con- 
vient au  contraire  de.  les  encourager,  à  la  condition  que 
Von  accompagne  les  chiffres  comparés  des  éclaircissements 
et  des  explications  nécessaires  pour  éviter  les  erreurs  d'in- 
terprétation; il  n'est  guère  d'autre  moyen  d'améliorer 
peu  à  peu  l'élaboration  des  statistiques,  de  mettre  en  relief 
les  défectuosités  et  d'atteindre  un  jour  l'uniformité  dési- 
rable des  relevés. 

Après  le  bouleversement  qui  a,  mis  tant  de  peuples  aux 
prises,  mais  qui  en  a  rapproché  aussi  et  qui  a  créé  des  liens 
nouveaux,  le  désir  que  l'on  ressent  de  toute  part  de  voir 
ces  liens  se  fortifier,  conduit  à  multiplier  et  à  rendre  plus 
intimes  les  relations  internationales  et  sociales,  à  les  scel- 
ler de  cette  confiance  mutuelle  qui  exige  une  connaissance 
suffisamment  étendue  des  circonstances  de  la  vie  écono- 
mique et  de  la  vie  sociale  dans  le  monde  nouveau.  Coor- 
donner les  informations  en  évitant  les  doubles  emplois, 
passer  ces  informations  au  crible  d'une  critique  judicieuse, 
mettre  au  point  les  écarts  et  les  rapports  constatés:  telle 
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est  l'œuvre  scientifique  qui  aidera  les  nations  à  se  mieux 
connaître  et  à  apprécier  leur  valeur  respective  dans  l'ef- 
fort commun  vers  la  prospérité  générale  et  la  justice. 

Pour  réaliser  cette  œuvre,  ou  pour  en  détacher  les  fruits 
les  plus  utiles,  des  ouvriers  instruits,  exercés  au  travail 
scientifique ,  pénétrés  des  principes  de  la  méthode  statis- 
tique, sont  nécessaires.  L'ouvrage  que  nous  présentons  au- 
jourd'hui au  lecteur  apprend  à  bien  observer  les  faits  dont 
s'occupe  la  statistique ,  à  apprécier  la  valeur  des  observa- 
lions  et  à  les  mettre  en  œuvre  pour  en  tirer  les  enseigne- 
ments les  plus  sûrs:  c'est  un  excellent  guide  où  chacun 
puisera  ce  qui  est  essentiel  dans  la  théorie  et  dans  la  pra- 
tique du  travail  statistique. 


Lucien  March. 
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La  division  de  l'ouvrage,  sa  genèse,  les  circonstances  dans 
lesquelles  il  a  été  écrit  sont,  indiquées  dans  la  Préface;  nous 
n'avons  rien  à  y  ajouter.  Il  est  utile  toutefois  d'insister  sur  ce 
point  que  nous  avons  voulu  donner  à  notre  travail  l'armature 
mathématique  indispensable,  mais  en  évitant  de  rebuter  le 
lecteur  et  de  tomber  dans  l'exagération  qui  semble  faire  de  la 
statistique  une  simple  division  des  mathématiques.  Sans  une 
bonne  observation,  il  n'y  a  pas  de  bonne  statistique;  sans  une 
critique  serrée,  il  n'y  a  pas  d'esprit  scientifique  ;  sans  esprit 
scientifique,  il  n'y  a  pas  d'utilisation  rationnelle  des  matériaux  : 
ce  sont  ces  quelques  idées  simples  qui  nous  ont  constamment 
guidé. 

Au  cours  de  ce  long  travail,  poursuivi  dans  des  circonstances 
pénibles,  nous  avons  eu  le  réconfort  de  précieux  encourage- 
ments. Nos  remercîments  vont  surtout  à  nos  amis  :  notre 
collègue,  M.  Ch.  De  Lannoy,  professeur  à  l'Université  de 
Gand  ;  M.  Beaujean,  directeur  de  la  Caisse  d'Épargne  et  de 
lietraite  sous  la  garantie  de  l'État,  à  Bruxelles,  et  M.  Lucien 
Mardi,  directeur  de  la  Statistique  Générale  de  la  France,  qui, 
avec  un  soin  dont  nous  leur  savons  infiniment  gré,  ont  revu  le 
manuscrit.  Nous  leur  sommes  redevable  de  maintes  amélio- 
rations et  corrections  ;  nous  leur  exprimons  ici  toute  notre 
reconnaissance. 

S'intéressant  dès  le  début  à  notre  œuvre,  notre  ami, 
M.  F.  Carpentier,  a  bien  voulu  prendre  sa  part  de  travail  en 
contrôlant  de  nombreuses  opérations  numériques  et  en  réunis- 
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saut  les  notes  d'après  lesquelles  ont  été  rédigés  les  nos  321-324 
et  336-338;  qu'il  trouve  ici  l'expression  de  nos  remercîinents 
cordiaux. 

Ce  volume  comprend  de  très  nombreuses  applications  numé- 
riques relatives  surtout  à  la  statistique  économique  et  sociale; 
l'auteur  espère  que  le  soin  apporté  aux  calculs  les  aura 
préservées  de  toute  erreur  ;  il  serait  reconnaissant  au  lecteur  de 
lui  signaler  celles  qui  auraient  pu  lui  échapper. 

A.  J. 

Bruxelles,  le  15  novembre  1920. 
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CHAPITRE  PREMIER 
Phénomènes  étudiés  par  la  statistique. 


I.  —  Phénomènes  typiques  et  phénomènes  collectifs. 

1.  A  les  considérer  sous  l'aspect  de  la  méthode  applicable 
è  leur  étude,  les  phénomènes  se  partagent  en  deux  caté- 
gories. Les  uns  sont  strictement  typiques  :  chaque  cas 
individuel  est  identique  à  un  autre  cas  de  même  nature,  se 
présentant  dans  des  conditions  semblables.  Des  expériences 
répétées  aboutissent  partout  au  même  résultat.  Que  l'on 
procède  à  ces  expériences,  dans  des  conditions  diverses  de 
temps  et  de  lieu,  on  verra  que  la  règle  de  formation  du 
phénomène  reste  une.  Les  sciences  appliquées  à  la 
nature  inorganique  fournissent  les  exemples  les  meilleurs 
dans  cet  ordre  d'idées.  La  réaction  chimique  de  deux  corps 
est  constante  :  si  l'on  remarque  une  déviation  par  rapport 
aux  résultats  précédents,  c'est  une  preuve  que  les  condi- 
tions de  l'expérience  n'ont  pas  été  identiques.  Une  dissolu- 
tion de  soufre  dans  du  sulfure  de  carbone,  abandonnée  à 
froid  à  l'évaporation  spontanée,  cristallise  en  cristaux 
octaédriques  :  chauffés  à  110°,  ces  cristaux  se  transforment 
en  un  agrégat  de  cristaux  prismatiques.  La  millième  expé- 
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rience  ne  diffère  pas  de  la  première  et  nous  atteignons  à  la 
connaissance  de  la  norme  par  une  seule  expérimentation. 

Les  autres  phénomènes,  au  contraire,  qu'on  appelle  phé- 
nomènes collectifs,  sont  atypiques;  leurs  manifestations 
varient  sans  qu'on  puisse  leur  attribuer  une  règle  fixe. 
Ils  sont  extrêmement  nombreux.  On  les  rencontre  non  seu- 
lement parmi  les  faits  sociaux,  mais  aussi  dans  les  sciences 
zoologiques  ou  botaniques,  en  météorologie  comme  en  méde- 
cine ou  en  économie  politique.  Lorsqu'on  étudie  la  compo- 
sition d'un  groupe  de  population,  on  se  trouve  en  présence 
de  phénomènes  collectifs,  mais  la  démographie  n'est  pas 
l'unique  domaine  où  ils  se  manifestent  en  aussi  grand 
nombre,  ils  sont  tout  aussi  fréquents  en  météorologie,  par 
exemple.  Ceci  est  important  sous  le  rapport  méthodologique 
et  nous  aurons  à  y  insister  plus  tard.  Ce  que  nous  retenons 
à  présent,  c'est  que  les  phénomènes  collectifs,  essentielle- 
ment différents  de  ceux  qu'on  appelle  typiques,  ne  se  ren- 
contrent pas  exclusivement  parmi  les  faits  sociaux,  ainsi 
que  la  réflexion  l'indique  à  chacun  sans  difficulté. 

2.  Examinons  brièvement  deux  exemples  de  phénomènes 
collectifs,  sous  le  rapport  de  la  méthode  d'observation  qui 
s'impose  en  ce  qui  les  concerne. 

La  classe  ouvrière  est  exposée  à  un  grand  nombre  d'acci- 
dents- résultant  du  travail.  Ce  nombre  n'est  pas  le  même 
chaque  année;  les  accidents  ne  sont  pas  aussi  fréquents 
dans  toutes  les  industries  ;  leur  gravité  varie,  comme  aussi 
les  charges  que  leur  réparation  entraîne,  la  nature  des 
lésions  survenues,  la  durée  et  l'étendue  de  l'incapacité  de 
travail  qui  en  résulte,  etc.  Il  ne  suffit  donc  pas  d'observer 
quelques  accidents  de  travail  pour  être  informé  de  la  gra- 
vité du  mal;  il  faut  les  compter  tous,  les  observer  chacun 
en  particulier,  les  comparer  au  nombre  d'ouvriers  exposés 
à  un  même  risque,  en  connaître  la  gravité  et  les  consé- 
quences, enfin  cataloguer  ces  cas  multiples  d'après  des 
catégories  qu'à  première  vue  nous  pouvons  imaginer  fort 
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nombreuses  et  compliquées.  Alors  seulement  nous  pourrons 
nous  former  une  notion  de  l'accident  du  travail,  car  les 
manifestations  de  ce  fait  varient  à  l'infini  et  nous  ne  pou- 
vons savoir  à  l'avance  à  quelles  lois  elles-  obéissent.  Ce  n'est 
pas  en  observant  une  seule  ou  plusieurs  de  ces  manifes- 
tations que  nous  y  parviendrons,  mais  en  les  relevant  toutes 
et  en  tenant  compte  des  conditions  dans  lesquelles  elles  se 
produisent. 

Sous  nos  climats  occidentaux,  il  pleut  souvent  et  les 
heures  ensoleillées  nous  sont  parcimonieusement  mesurées. 
Pour  savoir  dans  quelle  mesure  la  pluie  tombe,  ou  quelle 
est  la  fréquence  de  l'apparition  du  soleil,  nous  ne  pouvons 
nous  contenter  de  noter  qu'il  pleut  ou  qu'il  ne  pleut  pas  tel 
jour,  que  le  ciel  est  resté  couvert  ou  que  le  soleil  a  brillé. 
Il  nous  faut,  au  contraire,  nous  livrer  à  des  observations 
régulières  pendant  une  série  d'années,  répartir  les  obser- 
vations d'après  les  mois  pendant  lesquels  elles  sont  faites, 
mesurer  la  quantité  d'eau  tombée,  compter  les  heures  de 
soleil,  etc.  D'après  ces  calculs,  nous  serons  en  mesure  de 
définir,  à  ce  point  de  vue  particulier,  le  climat  du  pays  que 
nous  habitons;  encore  ne  pourrons-nous  le  faire  avec  cer- 
titude que  pour  les  régions  qui  avoisinent  les  postes 
d'observation.  Le  climat  est  un  phénomène  collectif,  dont 
les  manifestations  sont  variables,  et  dont  la  norme  ne  peut 
se  définir  qu'à  l'aide  d'un  grand  nombre  d'observations. 

La  méthode  qui  observe  les  variables  pour  en  déduire  le 
normal  ou  le  typique  convient  essentiellement  aux  phéno- 
mènes collectifs,  comme  l'expérimentation  convient  aux 
phénomènes  typiques  :  c'est  la  méthode  statistique. 

3.  La  différence  profonde  qui  sépare  les  phénomènes  ty- 
piques des  phénomènes  collectifs,  en  ce  qui  concerne  le  mode 
de  leurs  manifestations  et,  par  conséquent,  la  méthode 
d'après  laquelle  il  convient  de  les  observer,  tient  évidem- 
ment à  la  simplicité,  d'une  part,  à  la  complexité,  d'autre 
part,  des  causes  agissantes.  Dans  la  nature  inorganique,  les 
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causes  qui  interviennent  sont  constantes;  pourvu  que  les 
conditions  dans  lesquelles  elles  opèrent  soient  semblables, 
elles  reproduisent  mécaniquement  les  mêmes  effets.  Elles 
ne  pourraient  en  produire  d'autres.  L'expérimentation 
réalisée  dans  des  conditions  rigoureuses  ne  peut  donc  que 
répéter  des  résultats  identiques;  aussi  est-il  inutile  de  la 
multiplier.  Dans  les  faits  collectifs,  au  contraire,  il  y  a  une 
multitude  de  causes  opérantes  qui  s 'entre- croisent,  s'enche- 
vêtrent et  produisent  des  différenciations  infinies  dans  les 
manifestations  des  phénomènes.  D 'où  cette  conséquence  que 
si  l'on  veut  dégager  les  caractères  les  plus  fréquents,  les 
tendances  les  plus  communes,  il  faut  nécessairement  obser- 
ver un  grand  nombre  d'unités,  afin  de  réunir  tous  les  cas- 
possibles  et  classer  ensemble  ceux  qui  présentent  de&  ana- 
logies. Cette  besogne  de  classement  est  d'autant  plus 
longue  et  présenté  d'autant  plus  de  difficultés  que  le&  causes 
agissantes  sont  nombreuses  et  enchevêtrées.  Mais  il  n'y  a 
pas  d'autre  moyen  de  parvenir  à  la  connaissance  des  faits 
collectifs  et  l'on  peut  dire  en  toute  raison  que  le  procédé 
statistique  est  indispensable  pour  décrire  et  analyser  les 
groupes  trop  étendus  ou  trop  complexes  qui  ne  peuvent 
être  saisis  par  la  simple  observation  scientifique  isolée  (1). 

4.  Si  les  phénomènes  collectifs  étaient  soumis  à  des  varia- 
tions incessantes,  telles  que  les  traits  observés  aujourd'hui 
ne  seraient  plus  vrais  demain,  il  n'y  aurait  qu'un  intérêt 
fugitif  à  les  observer  ;  on  pourrait  même  dire  que  cet  intérêt 
serait  trop  mince  pour  justifier  la  peine  et  la  dépense  que 
coûtent  les  observations  portant  sur  des  masses  considé- 
rables. C'est  l'opinion  que  se  forment  souvent  de  la  sta- 
tistique certaines  personnes  qui  n'ont  qu'une  notion  incom- 
plète du  concept  de  loi  sociale,  économique  et  statistique. 
Parce  qu'elles  se  rendent  compte  de  ce  que  le  monde  éco- 


(1)  Wagnek,  Les  fondements  de  l'économie  politique,  t.  I,  p.  289.  Paris, 
Giard  et  Brière,  1904. 
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nomique,  par  exemple,  est  soumis  à  une  évolution  inces- 
sante, elles  se  persuadent  facilement  que  les  recherches  de 
la  statistique  sont  oiseuses.  A  quoi  bon  s'efforcer  de  saisir 
une  situation  changeante  à  tout  moment,  et  de  quelle  utilité 
peuvent  être  des  constatations  qui  se  trouvent  depuis  long- 
temps périmées  lorsqu'elles  sont  livrées  à  la  publicité? 
Cette  opinion,  assez  répandue,  ne  tient  pas  compte  de  la 
nature  des  causes  qui  interviennent  dans  les  phénomènes 
collectifs.  Ces  causes  sont  de  deux  espèces.  Les  unes  ont 
quelque  chose  de  général  et  de  permanent.  Elles  sont  com- 
munes à  toutes  les  manifestations  individuelles  du  phéno- 
mène. Parfois,  elles  se  manifestent  d'une  façon  continue; 
parfois,  elles  ne  font  sentir  leurs  effets  qu'à  un  moment 
donné,  mais  d'une  façon  néanmoins  régulière  (1).  D'autres 
causes,  au  contraire,  présentent  le  caractère  opposé. 
Elles  sont  propres  à  une  situation  donnée,  elles  n'inté- 
ressent qu'une  manifestation  isolée  d'un  phénomène,  elles 
n'exercent  pas  d'action  sur  toutes  les  manifestations,  mais 
seulement  sur  quelques-unes  et  en  nombre  variable.  On  peut 
donc  dire  qu'au  lieu  d'être  générales,  elles  sont  spéciales, 
et  accidentelles  au  lieu  d'être  permanentes.  Dans  les 
phénomènes  collectifs,  les  deux  catégories  de  causes  se 
retrouvent,  elles  s'entre-croisent,  elles  se  contrarient,  elles 
s'ajoutent  ou  se  contre-balancent.  Toutefois,  il  est  évident 
que  de  ces  deux  sortes  de  causes,  celles  qui  ont  un  caractère 
général  et  permanent  exerceront  une  action  beaucoup  plus 
décisive  que  les  autres. 

Les  causes  accidentelles  ont  une  tendance  à  se  faire  équi- 
libre, à  s  'annihiler  réciproquement.  Le  but  de  la  recherche 
s 'exerçant  sur  les  phénomènes  collectifs  est  de  dégager  les 


(1)  Ce  sont  les  causes  que  Quetelet  appelait  causes  constantes,  à  raison  de 
la  continuité  de  leurs  manifestations  et  de  l'égalité  de  leur  intensité,  comme 
il  nommait  causes  variables,  celles  dont  l'action  continue  se  présentait  avec 
une  énergie  sujette  à  changement.  Knapp  avait  proposé  de  réunir  sous  le 
nom  de  causes  essentielles  les  causes  constantes  et  les  causes  variables. 
(Cf.  J.  LoTTiN,  «  Le  calcul  des  probabilités  et  les  régularités  statistiques  », 
Revue  Néo-Scolastique,  1910,  pp.  45-46). 
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causes  agissantes  diverses  e,t  particulièrement  les  causes 
générales,  de  façon  à  exprimer  ce  que  le  phénomène  pré- 
sente de  permanent  et  de  typique,  comme  aussi  de  montrer 
les  modifications  que  les  éléments  permanents  subissent 
au  cours  des  années,  ce  qui  permet  de  tracer  la  courbe  d'évo- 
lution du  phénomène.  Ainsi,  l'on  peut  dire  que  la  statistique, 
méthode  propre  aux  phénomènes  collectifs,  a  pour  objet 
final  la  recherche  de  l'absolu  parmi  le  relatif,  du  typique 
parmi  l'accidentel,  du  permanent  parmi  le  passager. 

II.  —  Notation  numérique  des  observations. 

5.  La  nécessité  de  consigner  les  résultats  de  l'observation 
sous  forme  de  données  numériques  est  l'un  des  caractères 
fondamentaux  du  procédé  statistique;  on  peut  la  placer 
immédiatement  après  la  distinction  entre  les-  phénomènes 
typiques  et  les  phénomènes  collectifs.  Non  seulement  elle 
exerce  une  influence  décisive  sur  toute  la  technique,  mais 
elle  a  aussi  une  action  prépondérante  sur  les  méthodes  cri- 
tiques et  les  procédés  d'interprétation  à  employer.  C'est  à 
tort  que  certains-  auteurs  ont  semblé  n'attacher  qu'une 
importance  secondaire  à  ce  caractère  de  la  statistique  et  ne 
lui  ont  accordé  que  peu  d'attention.  C'est  une  erreur  plus 
grande  encore  de  croire  que,  dans  certains  cas,  la  statis- 
tique peut  se  passer  de  la  notation  numérique.  D'après 
Wagner,  les  situations  créées  par  les  résistances  des  sujets 
de  l'observation,  leur  'état  de  civilisation,  leurs  préjugés 
pouvant  mettre  obstacle  à  la  recherche  statistique,  il 
serait  alors  permis  de  se  contenter  d'évaluations  approxi- 
matives, faute  de  nombre  précis.  Les  expressions-  générales, 
dit-il,  telles  que  :  beaucoup,  peu,  plus,  moins,  plus  grand, 
moindre,  etc.,  ne  doivent  pas  être  bannies  de  la  méthode 
statistique  lorsque  les  données  plus  exactes  font  défaut. 

Wagner  reconnaît  cependant  que  dans  les  cas  qu'on  vient 
d'indiquer,  la  méthode  statistique  perd  de  sa  valeur.  C'est 


PHÉNOMÈNES  ÉTUDIÉS  PAR  LA  STATISTIQUE 


7 


en  condamner  l'emploi  dans  les  cas  que  l'on  vise,  car  on 
ne  conçoit  pas  une  recherche  scientifique  basée  sur  deux 
méthodes  :  l'une  qui  est  reconnue  bonne,  l'autre  qui  est 
certainement  défectueuse.  Cette  dernière  n'est  pas  à  em- 
ployer, et  si  l'on  n'a  pas  la  possibilité  de  recourir  à  la  bonne 
méthode,  la  seule  existante  sous  le  rapport  scientifique,  il 
est  bien  préférable  de  conclure  que  la  recherche,  dans  les 
conditions  actuelles,  n'est  pas  possible. 

Le  chimiste,  le  physicien,  le  biologiste  emploient  indiffé- 
remment l'observation  et  l'expérimentation,  afin  d'arriver 
à  caractériser  les  phénomènes  qu'ils  étudient.  Comme  ce 
sont  des  phénomènes  typiques,  l'observateur  n'a  pas  à  se 
préoccuper  de  l'aspect  quantitatif;  il  n'a  qu'à  envisager 
l'aspect  qualitatif,  ce  qui  fait  que  ses  remarques  prennent 
naturellement  la  forme  écrite  descriptive. 

Le  statisticien,  au  contraire,  étudie  des  phénomènes  col- 
lectifs atypiques  :  pour  les  décrire,  il  recourt  à  rémuné- 
ration, au  dénombrement,  il  les  considère  sous  le  rapport 
quantitatif.  C'est  en  chiffres  qu'il  traduit  ses  observations. 

La  notation  numérique  est  un  procédé  propre  à  la  mé- 
thode statistique,  qui  ne  se  rencontre  pas  dans  les  autres 
et  qui  est  le  seul  dont  on  puisse  se  servir  à  propos  des  phé- 
nomènes collectifs  pour  la  connaissance  desquels  la  méthode 
statistique  est  indispensable.  A  raison  de  son  importance, 
il  ne  sera  pas  inutile  de  s'y  arrêter  quelque  peu. 

6.  Lorsque  le  relevé  est  achevé  et  que  les  divisions  de 
la  classification  sont  établies,  le  statisticien,  au  moyen  du 
dépouillement,  compte  le  nombre  de  fois  que  se  rencontre 
telle  variété  appartenant  à  un  groupe  donné  de  classement, 
par  exemple  le  nombre  de  salaires  de  3  francs  à  fr.  3.49 
existant  dans  un  groupe  ouvrier  dont  il  étudie  la  distri- 
bution sous  le  rapport  du  salaire.  Les-  chiffres  inscrits  par 
le  statisticien  dans  ses  tableaux  signifient  que  l'unité  dont 
il  fait  usage  se  rencontre  autant  de  fois  sous  l'aspect  de 
telle  variété  :  les  chiffres  expriment  donc  une  idée  de  fré- 
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quence  qui  sert  à  interpréter  le  phénomène  collectif  dont 
les  manifestations  individuelles  sont  variables.  Ainsi,  par 
exemple,  les  établissements  industriels  d'un  pays  n'ont  pas 
tous  la  même  importance.  En  admettant  que  le  nombre 
d'ouvriers  occupés  dans  chaque  établissement  soit  un  indice 
suffisant,  on  commence  par  isoler  ce  caractère  pour  chaque 
entreprise,  puis  on  partage  la  série  en  un  certain  nombre 
de  classes  :  établissements  comptant  de  1  à  5  ouvriers,  de 
6  à  10,  de  11  à  20,  etc.,  et  dans  chaque  colonne  on  inscrit  le 
nombre  d'entreprises  qui  présentent  ce  caractère.  Cette 
statistique  indique  que  sur  la  masse  des  entreprises,  celles 
qui  occupent  de  1  à  5  ouvriers,  etc.,  se  rencontrent  autant 
de  fois.  De  là,  on  déduira  ensuite  que  la  petite,  la  moyenne, 
la  grande  industrie,  sont  plus  ou  moins  représentées  dans 
l'ensemble.  On  fera  varier  ce  classement  en  l'établissant 
par  industrie  et  en  recherchant  quelles  sont  les  différences 
qui  se  marquent  dans  la  grandeur  des  établissements,  selon 
qu'ils  appartiennent  à  telle  industrie  ou  à  telle  autre.  On 
étendra  encore  cette  recherche  en  ajoutant  la  base  de 
l'unité  territoriale  et  en  étudiant  le  rapport  qui  se  marque 
entre  la  grandeur  des  entreprises  et  leur  répartition  géo- 
graphique, en  d'autres  termes,  en  recherchant  s'il  existe 
des  zones  de  grande  et  de  petite  industrie,  etc.  On  procède 
donc  d'après  les  règles  de  la  connaissance  intellectuelle, 
par  abstraction,  c'est-à-dire  que  l'on  considère  successive- 
ment chaque  caractère  après  un  autre  caractère,  procédé 
que  rend  seule  possible  la  notation  numérique  des  obser- 
vations. 

7.  La  notation  numérique  présente  des  avantages  sérieux, 
comme  aussi  elle  a  ses  dangers  et  ses  inconvénients.  Au 
nombre  de  ses  avantages,  on  doit  lui  reconnaître  la  pré- 
cision. Il  est  certain  que  la  présentation,  sous  forme  de  ta- 
bleaux, d'une  série  bien  ordonnée  de  chiffres,  recueillis  à 
l'aide  d'une  technique  parfaite,  doit  aider  beaucoup  à  la 
découverte  des  causes  et  des  tendances,  c'est-à-dire  contri- 
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buer  au  but  de  la  statistique.  La  disposition  tabcllaire  des- 
données  de  la  statistique  a  toujours  été  considérée  comme 
un  perfectionnement  sur  les  procédés  antérieurement  en 
usage,  à  l'époque  où  la  statistique  n'était  encore  considérée 
que  comme  une  science  descriptive  de  l'Etat  :  «  Les  ta- 
bleaux, dit  Engel,  peuvent  se  comparer  à  un  ensemble  de 
fonctions  de  diverses  natures;  les  valeurs  de  la  première 
colonne  correspondent  aux  données  indépendantes,  aux 
constantes  ;  celles-ci  une  fois  bien  établies,  les  nombres  des 
colonies  suivantes  varient  avec  les  premières,  et  sont 
comme  les  variables  dépendantes  des  constantes.  » 

Ainsi,  dans  une  statistique  des  salaires,  les  variables 
sont  constituées  par  les  nombres  d'ouvriers  gagnant 
chaque  taux  de  salaire,  les  constantes  étant  représentées 
par  la  nature  de  l'industrie,  ou  une  base  géographique,  ou 
le  caractère  de  grande  ou  de  petite  industrie.  Les  différents 
tableaux  qu'on  obtient  de  la  sorte  font  connaître  l'influence 
que  la  nature  de  l'industrie,  ou  la  localisation  de  l'entre- 
prise, ou  la  grandeur  des  établissements  peuvent  exercer 
sur  la  répartition  des  salaires  parmi  une  population 
ouvrière  donnée. 

Le  fait  que  les  observations  statistiques  se  traduisent  en 
chiffres  est  la  cause  de  certains  inconvénients.  Au  premier 
rang  de  ceux-ci  nous  notons  la  trop  grande  rigidité  appa- 
rente de  certaines  constatations.  Parce  qu'elles  sont  expri- 
mées en  chiffres,  les  conclusions  de  la  statistique  pa- 
raissent empreintes  d'une  certitude  absolue.  On  ne  discute 
pas  contre  un  chiffre,  dit-on  ;  non,  mais  on  discutera  utile- 
ment la  méthode  à  l'aide  de  laquelle  ce  chiffre  a  été  obtenu, 
et  on  pourra  ainsi  discuter  sa  signification  véritable.  Il  faut 
éviter  avec  soin  que  l'esprit  critique  ne  soit  annihilé  par 
l'appareil  rigide  dont  sont  entourées  les  données  statis- 
tiques. 

8.  La  notation  numérique  consiste  essentiellement  en  un 
relevé  quantitatif,  mais  il  serait  faux  de  considérer  que  la 
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statistique  n'envisage  que  le  côté  quantitatif  des  phéno- 
mènes qu'elle  observe.  Elle  est  également  basée  sur  l'aspect 
qualitatif  des  choses;  seulement  les  deux  aspects  ne  sont 
pas  envisagés  en  même  temps,  ou  dans  la  même  phase  des 
opérations  techniques.  Dans  un  relevé  démographique  por- 
tant sur  une  population  classée  d'après  l'état  civil,  on 
divisera  cette  population  en  plusieurs  classes  :  célibataires, 
mariés,  veufs,  divorcés  ou  séparés.  L'opération, de  classe- 
ment par  laquelle  on  a  reconnu  qu'il  y  avait  lieu  de  diviser 
la  population  en  quatre  classes  quand  on  désire  l'étudier 
sous  le  rapport  de  l'état  civil  des  personnes  qui  la  com- 
posent, cette  opération  répond  à  une  distinction  qualitative 
et  elle  s'effectue  du  moment  où  le  s-tatisticien  arrête  les  clas- 
sifications qui  vont  lui  servir.  Cette  classification,  que  nous 
venons  de  citer,  est  très  simple,  mais  il  en  est  de  plus  com- 
plexes et  dont  les  éléments,  moins  clairement  indiqués  par 
la  nature  des  choses,  peuvent  être  discutés.  Dans  une  sta- 
tistique industrielle,  nous  voulons,  par  exemple,  répartir 
les  entreprises  industrielles  d'après  le  mode  d'exploitation. 
Nous  pouvons  concevoir  des  distinctions  basées  sur  les 
principes  suivants  de  différenciation  :  1°  les  entreprises 
peuvent  être  de&  entreprises  individuelles  ou  des  associa- 
tions de  personnes  ou  des  associations  de  capitaux  ;  2°  dans 
les  entreprises  individuelles  ou  qui  sont  constituées  sur  la 
base  d'associations  de  personnes,  on  peut  reconnaître  des 
entreprises  de  minime  importance  dans  lesquelles  l'exploi- 
tant travaille  seul,  ou  bien  dans  lesquelles  il  travaille  avec 
des  membres  de  sa  famille  seulement  ;  à  un  degré  supérieur, 
on  reconnaîtra  les  entreprises  qui  ont  recours  à  des  ouvriers 
étrangers  à  la  famille  de  l'exploitant,  etc.  Le  travail  de  clas- 
sification est  par  sa  nature  qualitatif.  C'est  lorsque  les 
classifications  sont  établies  que  la  phase  quantitative  se 
déroule  dans  l'opération  statistique.  L'opérateur  reconnaît 
alors  que  l'unité  qu'il  considère  appartient  à  une  classe 
déterminée,  il  la  note  dans  cette  classe  et  finalement  il 
compte  le  nombre  de  fois  que  des  unités  de  cette  sorte  se 
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sont  rencontrée»  dans  le  relevé.  Cette  opération  est  la  suite 
de  la  première,  qui  consiste  à  arrêter  une  place  au  pro- 
gramme de  classement  d'après  lequel  on  comptera  les  unités 
dénombrées. 

La  statistique  présente  donc  dans  ses  opérations  diverses 
le  caractère  des  méthodes  scientifiques  :  elle  abstrait,  elle 
considère  les  choses  selon  le  point  de  vue  qualitatif  et  quan- 
titatif, elle  aborde  successivement  l'aspect  discriminatif 
et  unitif  des  phénomènes  qu'elle  considère. 


CHAPITRE  11 
Différentes  conceptions  de  la  statistique. 


I.  —  Développement  de  la  statistique. 

9.  La  conception  de  la  statistique  que  se  sont  faite  les 
savants  a  varié  au  cours  des  temps.  Pour  cette  raison,  il 
semble  indispensable  de  faire  brièvement  un  historique  de 
la  statistique,  afin  de  montrer  comment  elle  a  été  comprise 
et  de  dégager  à  la  fin  la  notion  vraiment  scientifique  que 
l'on  peut  s'en  faire.  Cependant,  ce  travail  n'essaye  en 
aucune  façon  de  retracer  l'histoire  de  la  statistique.  La 
raison  pour  laquelle  nous  nous  en  abstenons  est  double  : 
d'abord  parce  que  l'histoire  de  la  statistique  a  été  faite 
souvent  et  avec  les  détails  les  plus  étendus  ;  pour  en  avoir 
une  idée,  il  suffit  de  parcourir  les  ouvrages  de  Gabaglio, 
de  Meitzen  ou  de  Wagner,  dans  lesquels  une  énorme  éru- 
dition a  été  dépensée,  à  ce  point  qu'on  ne  peut  guère  espérer 
y  ajouter  quelque  chose  d'important.  Ensuite  parce  que  ce 
n'est  pas  le  point  de  vue  historique  qui  nous  intéresse, 
mais  l'aspect  méthodologique.  Toutefois,  dans  la  longue 
chaîne  d'ouvrages  et  d'auteurs,  il  y  a  lieu  de  noter  quelques 
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sommet»,  afin  de  rattacher  à  des  œuvres  connues  et  à  des 
noms  souvent  cités  en  statistique,  les  théories  générales 
dont  la  succession  sera  envisagée  au  cours  du  présent 
exposé. 

10.  On  trouve  dans  l'antiquité  comme  au  moyen-âge  de 
nombreux,  exemples  de  travaux  statistiques  exécutés  sur 
l'ordre  des  gouvernements.  L'Egypte  fit  enregistrer  tous 
les  chefs  de  familles,  la  Judée  eut  ses  recensements  de  la 
population,  la  Chine  ses  descriptions  statistiques  du  terri- 
toire, la  Grèce  ses  dénombrements  servant  tantôt  à  répartir 
les  terres  entre  la  population,  tantôt  à  établir  l'assiette  des 
impôts,  tantôt,  enfin,  à  déterminer  le  nombre  des  citoyens 
et  la  condition  des  habitants.  Rome  fit  un  fréquent  usage 
des  recensements  :  le  census  en  présence  du  censeur  se 
répéta  69  fois;  on  notait,  dans  des  temples  désignés,  les 
naissances,  la  puberté  et  les  décès  (1).  Le  moyen-âge 
n'ignora  pas  les  travaux  de  statistique.  Le  Domesday  book 


(1)  Le  recensement  (censere)  se  faisait  au  Champ  de  Mars  et  se  répétait 
tous  les  cinq  ans.  Un  censeur,  tiré  au  sort,  présidait  l'assemblée.  Le  recen- 
sement servait  de  base  à  l'impôt  et  s'adressait  uniquement  aux  «  assidui  »  ou 
«  capite  censi  »,  opposés  aux  «  proletarii  »,  lesquels  étaient  placés  en  dehors 
des  cinq  classes  basées  sur  la  fortune.  Lois  du  recensement,  chaque  citoyen 
devait  déclarer  ses  noms  et  prénoms,  son  âge.  sa  famille,  le  nombre  de  ses 
esclaves  et  ses  biens  de  toute  nature.  C'est  à  l'occasion  du  cens  que  les  cen- 
seurs exerçaient  leur  pouvoir  disciplinaire  par  la  nota  placée  en  regard  du 
nom:  elle  entraînait  la  suppression  du  droit  de  suffrage  {in  aerwrios  referre)  . 

lie  texte  suivant  d'Aulu-Gelle  prouve  que  le  recensement  était  effectué  avec 
une  grande  rigueur  : 

Inter  censorias  severitates  tria  haec  expmpla  in  litteris  sunt  castigatissimae 
disciplinae.  Unum  est  hujuscemodi.  Censor  agebat  de  uxoribus  solemne  jus- 
jurandum.  Verba  erant  ita  concepta  :  «  Et  tu,  ex  animi  sententia,  uxorem 
habes  ?  »  Qui  jurabat,  cavillator  quidem  et  canicula  et  nimis  ridicularius  fuit. 
Is,  locum  esse  sibi  joci  dicendi  ratus,  quum  ita,  uti  mos  erat.  censor  dixisset  : 
«  Et  tu,  ex  animi  tui  sententia,  uxorem  habes  ?  —  Habeo  equidem,  inquit, 
uxorem.  sed  non  hercle  ex  animi  mei  sententia.  »  Tum  censor  eum,  quod 
intempestive  lascivisset,  in  aerarios  retulit,  causamque  hanc  joci  scurrilis 
apud  se  dicti  subscripsit. 

Aulus  Gellius,  Noctes  itticae,  liv.  TV.  chap.  XX.  Paris,  C.-L.-F.  Panc- 
koucke,  éditeur,  1845,  t.  I,  p.  312. 
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de  Guillaume  le  Conquérant  rentre  dans  la  catégorie  des 
relevés  statistiques,  comme  auparavant  certains  relevés 
exécutés  sur  l'ordre  de  Charlemagne,  comme  plus  tard  de 
nombreux  inventaires,  établissement  de  rôles  ou  descrip- 
tions, dont  on  peut  retrouver  des  types  dans  beaucoup  de 
pays  de  l'Europe  centrale  et  occidentale.  Les  matières  sur 
lesquelles  portèrent  ces  investigations  font  partie,  incontes- 
tablement, du  domaine  assigné  à  la  statistique,  mais  il  faut 
renoncer  à  trouver,  dans  ces  recherches  entreprises  dès 
l'antiquité  et  le  moyen  âge,  aucun  principe  de  technique  et 
aucune  idée  précise  de  la  nature  scientifique  de  la  statis- 
tique. Ce  sont  des  vues  fragmentaires,  empiriques,  domi- 
nées par  les  circonstances  du  moment  qui  décident  de  l'op- 
portunité et  de  la  nécessité  de  tel  genre  de  recherches  ;  quant 
à  la  technique,  elle  est  dans  l'enfance  et  est  plus  ou  moins 
satisfaisante  selon  l'application  de  celui  qui  la  conçoit,  la 
conscience  de  ceux  qui  l'appliquent  et  la  bonne  volonté  de 
ceux  qui  doivent  se  soumettre  aux  investigations.  Il  faut 
que  le  besoin  d'ordre  et  de  connaissances  soit  devenu  gé- 
néral pour  que  la  statistique  s'organise  et  que  sa  notion 
exacte  se  dégage  peu  à  peu  de  l'empirisme  qui  a  marqué 
ses  débuts. 

11.  Lorsque  l'Etat  moderne  s'organisa,  on  sentit  de  plus 
en  plus  le  besoin  de  réunir  des  informations  exactes  sur 
tous  les  éléments  qui  le  composent  et  desquels  sa  prospérité 
dépend.  La  population,  l'armée,  les  finances,  l'industrie,  le 
commerce  sont  autant  de  points  sur  lesquels  les  investiga- 
tions des  statisticiens  de  l'époque  se  portent  avec  curiosité. 
Aujourd'hui  encore  ces  matières  sont  celles  que  la  statis- 
tique aborde  le  plus  communément,  mais  elle  le  fait  dans 
un  autre  esprit.  Les  auteurs  qui  écrivirent  sur  la  statistique 
à  partir  du  xvi*  siècle  visaient  avant  tout  la  connaissance 
de  l'Etat  et  de  ses  ressources.  Ce  qu'ils  créèrent,  ce  fut  une 
science  descriptive  de  l'Etat,  dont  tous  les  éléments  étaient 
destinés  à  l'Etat  lui-même.  Ce  n'était  pas  la  population  pour 
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elle-même  que  l'on  étudiait,  mais  la  population  en  tant 
qu'un  facteur  de  la  prospérité  de  l'Etat.  Rentrent  dans  les 
travaux  se  rattachant  à  cette  conception,la  ((Cosmographie)) 
de  Sébastien  Muenster  (1489-1552),  le  traité  «  del  governo 
ed  amministrazione  ))  de  Francesco  Sansovino  (1521-1586), 
les  ((  relationes  universales  ))  de  Giovanni  Botero  (1608), 
l'ouvrage  de  Pierre  d'Avity  (1572-1635),  intitulé  :  ((  les 
Etats,  Empires  et  Principautés  du  Monde  »,  enfin,  toute  la 
collection  des  «  Républiques  Elzéviriennes  »  commencée  en 
1626,  consacrée  à  la  description  des  Etats.  Cette  soixantaine 
de  petits  volumes  font  aujourd'hui  les  délices  des  amateurs 
de  livres  anciens,  mais,  à  les  feuilleter,  personne  ne  pourrait 
se  douter  qu'on  se  trouve  en  présence  d'une  œuvre  qui  passa 
autrefois  pour  appartenir  à  la  statistique. 

12.  Un  érudit,  Herman  Conring  (1606-1681),  médecin  ré- 
puté, professeur  à  l'Université  de  Helmstâdt,  fut  le  premier 
à  faire  de  ces  descriptions  politico-économiques  un  exposé 
systématique,  sous  la  forme  de  cours,  destiné  à  l 'enseigne- 
ment universitaire  (1660).  Il  emprunte  ses  données  aux 
publications  antérieures.  La  matière  qu'il  embrasse  dans 
ses  descriptions  est  appelée  par  lui  <(  Notifia  rerum  publi- 
carum  ».  L'exposé  qu'il  fait  est  basé  sur  la  méthode  aristo- 
télicienne; il  commence  par  décrire  le  ((  comment  »  des 
choses  :  ((  quemadmodum  res  alicujus  reipublicae  sese 
babeant,  ut  Aristoteles  solet  loqui  toû  ôti  »  ;  ensuite  il  exa- 
mine les  causes  de  l'état  de  choses  constaté  :  «  quibus  de 
causis  res  istae  hune  aut  illum  in  modum  se  habeant, 
quod  est  to  bion  ».  Pour  connaître  pleinement  la  situation 
de  chaque  Etat,  il  faut,  dit  Conring,  sur  ce  point  fidèle 
disciple  d'Aristote,  connaître  les  quatre  causes  suivantes  : 
1"  causa  materialis.  C'est  ce  qui  se  rapporte  à  l'esprit,  au 
corps,  à  la  fortune.  Pour  cette  dernière,  il  faut  distinguer 
les  biens  mobiliers  et  les  biens  immobiliers;  parmi  ces  der- 
niers se  trouve  la  terre  elle-même;  2°  causa  finalis,  c'est-à- 
dire  si  les  habitants  peuvent  vivre  heureux,  dans  la  pra- 
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tique  des  vertus  et  s'ils  ont  des  moyens  d'existence  suffi- 
sants; 3°  causa  formalis,  ou  manière  dont  le  pays  est  gou- 
verné; 4°  causa  efficients,  autrement  dit  :  «  omnes  qui 
regunt  ».  Cette  causa  efficiens  est  double;  comme  le  fait 
remarquer  Conring,  l'une  est  principale,  c'est  l'homme 
qui  gouverne;  l'autre  est  instrumentais  et  elle  se  divise  en 
deux  :  causa  animata  (ministres,  magistrats),  et  causa  non 
animât  a  (en  premier  lieu  l'argent).  C'est  aussi  à  cet  endroit 
qu'il  convient  de  parler  de  l'armée  et  de  la  navigation. 

Ces  détails  montrent  combien  l'enseignement  se  modèle 
encore  sur  les  formules  anciennes  et  font  saisir,  en  même 
temps,  combien  peu  cet  enseignement  se  rapproche  de  ce 
qu'il  est  convenu  aujourd'hui  de  désigner  sous  le  nom  de 
statistique.  Conring  n'a  pas  laissé  d'exposé  écrit  de  son 
œuvre,  mais  ses  leçons  furent  recueillies  et  publiées  par  ses 
disciples.  Le  nouveau  mode  d'exposer  cette  «  notifia  rerum 
publicarum  »  fut  suivi  par  de  nombreux  professeurs  en 
Allemagne.  Il  devait  appartenir  à  Achenwall  de  pousser 
à  un  degré  supérieur  cette  systématisation  de  la  description 
politico-économique  des  Etats. 

13.  Gottfried  Achenwall  (1719-1772),  professeur  à  l'Uni- 
versité de  Marburg,  puis  à  celle  de  Cfottingen,  continua 
l'œuvre  de  Conring;  mais,  d'après  Wagner,  il  donna  à  la 
statistique  une  entière  indépendance,  il  en  détermina  avec 
plus  d'exactitude  les  limites  et  l'objet,  il  la  popularisa 
comme  science  en  lui  donnant  un  nom  bien  à  elle,  il  lui 
assigna  un  domaine  plus  étendu  et  établit,  mieux  que  tout 
autre  avant  lui,  les  relations  étroites  de  la  statistique  avec 
la  vie  publique.  Tandis  que  les  travaux  de  Conring  ne 
furent  guère  connus  que  dans  des  milieux  scientifiques 
assez  limités,  ceux  d 'Achenwall  conquirent  la  notoriété. 
Les  érudits  allemands  se  sont  plu  à  lui  décerner  le  titre  de 
«  père  de  la  statistique  ».  Ceci  est  fort  exagéré.  Achenwall 
est  le  père  du  nom,  mais  pas  de  la  science.  S'il  y  avait 
quelque  utilité  à  cette  recherche  des  «  priorités  »,  on  trou- 
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verait  sans  peine  les  origines  de  la  science  en  Angleterre 
au  xviie  siècle,  au  lieu  de  lés  rechercher  en  Allemagne  au 
xvme. 

C'est  dans  l'introduction  de  son  œuvre  principale,  pu- 
bliée en  1749,  intitulée  :  «  Abriss  der  Neusten  Staatswis- 
senschaft  der  heutigen  vornehmsten  europâischen  Reicke 
und  Republiken  »,  qu'il  employa  pour  la  première  fois  le 
terme  de  «  statistik  »,  dérivé  de  l'italien  «  statista  ». 
Achenwall  faisait  remarquer  que  parmi  les  faits  qui  se 
passent  sous  nos  yeux,  certains  intéressent  grandement  la 
prospérité  publique,  en  accélèrent  ou  en  retardent  la 
marche.  Ce  sont  ces  faits  qui  constituent  vraiment  les  choses 
remarquables  de  l'Etat  dont  la  connaissance  constitue  le 
domaine  propre  de  la  statistique.  L'intérêt  de  l'Etat  est 
interne  et  externe;  les  moyens  d'augmenter  la  richesse,  de 
stimuler  la  population,  de  promouvoir  les  sciences,  l 'indus- 
trie et  le  commerce  visent  l'intérêt  interne;  les  alliances  et 
les  relations  étrangères  se  rattachent  à  son  intérêt  externe. 

La  statistique  chez  Achenwall  est  donc  une  description  de 
l'Etat,  elle  est  une  science  purement  descriptive.  Il  ne 
vient  pas  à  la  pensée  d 'Achenwall  de  déduire  des  faits 
observés  des  règles  générales,  des  lois  visant  la  marche  des 
phénomènes  qu'il  observe.  Son  ambition  se  borne  à  fournir 
des  éléments  qui,  par  leur  comparaison,  permettront  à 
l'homme  d'Etat  d'arriver  à  un  plus  haut  degré  de  sagesse 
politique.  Ses  travaux  de  statistique  descriptive  ont  porté 
sur  l'Espagne,  le  Portugal,  la  France,  l'Angleterre,  les 
Pays-Bas,  la  Russie,  le  Danemark  et  la  Suède.  L'Allemagne, 
la  Prusse  et  l'Autriche  ne  furent  pas  étudiées  parce  que,  à 
l'époque  d 'Achenwall,  la  description  de  l'Etat  était  con- 
sidérée, dans  ces  pays,  comme  une  branche  du  Droit  public, 
lequel  avait  son  enseignement  séparé.  L'exposé  d 'Achenwall 
dérive  des  travaux  publiés  à  son  époque,  il  ne  découle  pas 
de  recherches  originales  et  ne  fait  pas  la  critique  des  docu- 
ments qu'il  analyse;  par  sa  clarté,  sa  concision,  et  le  soin 
qu'il  apporte  dans  son  exposé,  Achenwall  est  un  modèle. 
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Son  œuvre  fut  traduite  dans  toutes  les  langues,  ce  qui 
contribua  à  répandre  le  nom  de  «  statistique  »  que  le  pro- 
fesseur de  Gottingen  avait  donné  à  la  discipline  nouvelle. 

14.  Achenwall  fit  école  et  pendant  de  longues  années  ce 
fut  sa  conception  de  la  statistique  qui  domina.  De  nombreux 
professeurs  exposèrent  la  statistique  d'après  ses  vues,  de 
non  moins  nombreux  manuels  parurent  qui  suivaient  fidè- 
lement sa  doctrine.  Sans  doute,  on  peut  relever  d'assez  fré- 
quentes divergences  avec  les  vues  du  professeur  de  Got- 
tingen, mais,  dans  l'ensemble,  l'école  d 'Achenwall  reste 
attachée  à  la  notion  de  science  descriptive  des  choses  les 
plus  remarquables  de  l'Etat.  Mais  à  quel  signe  reconnaître 
ces  ((  choses  remarquables  »  %  Un  des  plus  fidèles  disciples 
d 'Achenwall,  son  successeur  dans  la  chaire  universitaire  de 
Gottingen,  Louis  von  Schlozer  (1735-1809),  se  posant  cette 
question,  faisait  remarquer  que  ces  <(  choses  remarquables  » 
étaient,  somme  toute,  une  notion  variable  selon  le  temps, 
le  lieu,  les  circonstances.  Ce  qui  ne  mérite  pas  atten- 
tion aujourd'hui  peut  acquérir  demain  une  réelle  impor- 
tance; considérée  sous  l'aspect  de  l'intérêt  général,  telle 
chose  peut  être  dénuée  de  toute  importance,  mais  elle  peut 
devenir  digne  d'attention  si  on  prend  égard  à  tel  intérêt 
spécial,  particulier.  Il  fallait  donc  essayer  de  trouver  un 
critère  scientifique  d'après  lequel  on  pût  déterminer  plus 
exactement  le  rôle  et  les  limites  de  la  statistique.  A  la  fin 
du  xviii6  siècle,  on  le  voit  apparaître  sous  la  notion  de  la 
«  force  »  ou  des  «  ressources  »  de  l'Etat.  Tout  ce  qui 
regarde  la  puissance  de  l'Etat,  c'est-à-dire  l'étendue  de  son 
territoire,  la  population,  l'agriculture,  le  commerce,  l'in- 
dustrie, la  marine  marchande,  les  forces  de  terre  et  de  mer, 
constitue  le  domaine  propre  de  la  statistique.  Et  L.  von 
Schlozer,  donnant  corps  à  cette  conception  générale,  pré- 
cisait l'objet  propre  de  la  statistique,  à  l'aide  des  mots  : 
«  vires  unitae  agunt  »,  c'est-à-dire  :  «  vires  »,  les  forces 
naturelles  ou  acquises  (les  hommes,  le  territoire,  les  avan- 
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tages  naturels),  «  unitae  »,  la  forme  et  les  organes  du  gou 
vernement,  «  agunt  »,  le  gouvernement  et  l'administration. 

15.  Avant  que  l'école  de  Conring-Achenwall-Schlozer  se 
fondât  et  se  développât  en  Allemagne  d 'abord,  dans  la  plus 
grande  partie  de  l'Europe  ensuite,  un  courant  scientifique 
s'était  établi  en  Angleterre,  dont  l'orientation  spéciale  de- 
vait exercer  sur  la  statistique  une  influence  prépondérante. 
Il  s'agit  de  l'école  des  ((  arithméticiens  politiques  »,  dont 
Graunt  (1620-1674)  et  Petty  (1623-1687)  furent  les  repré- 
sentants les  plus  autorisés.  Leur  méthode  est  basée  sur 
l'observation  numérique,  mais  comme  à  leur  époque  les 
recherches  statistiques  dans  le  sens  où  nous  entendons  cette 
expression  aujourd'hui,  sont  rares,  coûteuses,  souvent 
même  impossibles,  c'est  par  des  calculs  approximatifs, 
l'emploi  des  proportions,  des  procédés  parfois  déconcer- 
tants, qu'ils  s'efforcent  de  suppléer  à  l'insuffisance  des 
données  numériques.  On  a  beaucoup  critiqué,  parfois  ridi- 
culisé, leurs  procédés,  mais  au  point  de  vue  qui  nous  occupe 
à  présent,  leur  méthode  numérique  est  extrêmement  intéres- 
sante parce  que,  perfectionnée  et  surtout  adaptée  aux  faits, 
c'est  elle  qui  va  se  substituer  plus  tard  à  la  science  pure- 
ment descriptive  d'Achenwall. 

Nous  nous  trouvons  bien  en  présence  de  la  doctrine  qui 
doit  devenir  la  statistique  telle  que  nous  la  connaissons 
et  la  pratiquons.  Certes,  ses  moyens  d'action  sont  limités, 
son  langage  est  encore  un  balbutiement,  mais  que  la 
technique  se  constitue,  que  les  facilités  matérielles  lui  soient 
acquises  et  elle  ne  tardera  pas  à  parler  haut  et  clair. 

L'essence  de  la  statistique  se  trouve  définie  par  Petty 
lui-même  dans  la  préface  de  son  «  Political  Arithmetic  » 
(1691)  :  «  La  méthode  que  je  suis,  ditril,  n'est  pas  encore 
fort  usitée  ;  au  lieu  de  me  servir  seulement  de  vocables  com- 
paratifs ou  superlatifs,  j'ai  voulu  m 'exprimer  au  moyen  de 
nombres,  de  poids  et  de  mesures,  me  servir  seulement  d'ar- 
guments matériels  et  considérer  uniquement  les  causes  qui 
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sont  visiblement  fondées  sur  la  nature  en  laissant  de  côté 
celles  qui  dépendent  des  sentiments,  des  opinions,  des  appé- 
tits et  des  passions  variables  des  hommes.  »  Avant  Petty, 
John  Graunt  avait  déjà  fait  (1662)  de  curieuses  recherches, 
basées  sur  les  registres  mortuaires  de  la  ville  de  Londres, 
recherches  dont  le  résultat  fut  présenté  à  la  «  Royal  So- 
ciety »  qui  venait  d'être  fondée  en  cette  ville.  Il  fut  le 
premier  à  attirer  l'attention  sur  la  prédominance  des  nais- 
sances masculines  sur  les  naissances  féminines,  qu'il  esti- 
mait être  dans  le  rapport  de  14  à  13,  soit  107  p.  c,  alors 
que  la  statistique  moderne  fixe  ce  rapport- à  105  p.  c.  envi- 
ron, montrant  ainsi  que  les  calculs  de  Graunt  n'étaient  pas 
si  éloignés  de  la  réalité.  De  même,  il  calcula  le  nombre  de 
décès  par  période  d'âges  et  montra  qu'à  l'aide  du  nombre 
de  décès  on  peut  connaître  le  nombre  de  vivants.  On  doit 
rattacher  à  la  même  école  et  à  la  même  tendance  la  forma- 
tion par  l'astronome  Halley  (1656-1742)  de  la  première 
table  dé  mortalité,  basée  sur  les  tables  de  naissances  et  de 
décès  dressées  entré  les  années  1687-1691  par  le  prébendier 
Gaspar  Neumann,  pour  la  ville  de  Breslau.  Les  travaux 
postérieurs  sur  l'assurance-vie  et  les  annuités  dérivent  de 
ces  premiers  essais;  ils  se  développèrent  surtout  en  Hol- 
lande et  en  Angleterre.  C'est  vers  la  même  époque  (1713) 
que  Jacques  Bernouilli  publia  son  travail  sur  le  calcul  des 
probabilités. 

16,  La  statistique  basée  sur  les  chiffres  au  lieu  de  con- 
sister en  une  description  plus  ou  moins  exacte  des  res- 
sources- de  l'Etat,  reçut  surtout  une  impulsion  décisive  à 
la  suite  de  la  publication  en  1741  de  l'œuvre  de  Johann 
Peter  Siissmilch  (1707-1767),  intitulée  «  L'ordre  divin  dans 
les  variations  du  genre  humain,  preuve  évidente  de  la  divine 
Providence  »,  etc.  Cette  œuvre  est  basée  exclusivement  sur 
les  registres  diocésains  de  la  Prusse  que  l'auteur,  membre 
du  consistoire,  avait  pu  consulter,  aisément.  L'œuvre  de 
Siissmilch,  s 'appuyant  sur  des  matériaux  inédits  et  d'une 
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grande  richesse,  a  une  valeur  scientifique  incontestable  ;  le 
rapport  de  21  naissances  masculines  à  20  naissances  fémi- 
nines- est  démontré  par  l'auteur,  en  même  temps  que  l'éga- 
lité du  nombre  des  individus  des  deux  sexes  à  l'époque  du 
mariage.  De  ce  fait,  Sùssmiich  conclut  à  l'ordre  divin  de 
la  monogamie.  Toute  son  œuvre  consiste  à  tirer  parti  des 
grands  nombres,  à  en  déduire  les  tendances  générales  qui 
expriment  les  normalités  ou  lois,  à  montrer  les  obstacles 
qui  contrarient  le  jeu  normal  de  ces  lois  voulues  par  la 
Divinité  et  à  en  réclamer  la  disparition.  Il  a  déjà  une  notion 
claire  de  l'analyse  statistique  et  lorsqu'il  traite  une  ques- 
tion, que  ce  soit  celle  de  la  mortalité  ou  celle  de  la  nuptialité, 
il  a  toujours  soin  d'en  examiner  les  différents  aspects  sous 
le  triple  rapport  du  temps,  de  l'espace  et  des  qualités. 

«  Lorsqu  'on  voit,  dit  Siissmilch,  que  sur  un  nombre  donné 
d'hommes,  il  y  en  a  autant  qui  meurent  une  année  que 
l'autre;  qu'en  outre,  en  un  temps  donné,  il  meurt  tant  d'en- 
fants, de  jeunes  gens,  d'adultes,  de  vieillards-;  que  les  deux 
sexes  se  reproduisent  dans  une  proportion  constante, on  doit 
admettre  qu'en  toutes  ces-  choses  il  existe  un  ordre,  et  même 
un  ordre  extraordinairement  majestueux,  beau  et  parfait.  » 
Trouver  l'application  de  cet  ordre  divin  dans  les  phéno- 
mènes humains-  n'était  pas  difficile,  mais  il  fallait  que, 
comme  Colomb  a  découvert  l'Amérique,  quelqu'un  indiquât 
la  voie  à  suivre  :  ce  Colomb  de  la  statistique,  écrit  Siissmilch, 
a  été  Graunt,  qui,  par  ses  observations  dans  les  registres 
des  morts  et  des  malades,  à  Londres,  avait  été  amené  à 
conclure  à  l'exis-tence  de  cet  ordre,  et  à  sa  généralisation 
dans  les  autres  phénomènes  de  la  vie  humaine. 

L'œuvre  de  Siissmilch  a  une  très  grande  importance. 

Si  l'on  peut  considérer  l'œuvre  d'Achenwall  comme  la 
personnification  de  la  statistique  descriptive,  on  doit  voir 
en  'Siissmilch  un  des  promoteurs  de  la  statistique  mathé- 
matique. La  statistique  chez  Achenwall  est  une  science 
descriptive  de  l'Etat,  science  qui  vise  spécialement  les  con- 
ditions sociales  à  un  moment  déterminé.  Cette  description 
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a  une  utilité  pratique,  tant  pour  l'administration  que  pour 
la  politique.  Siïssmilch  a  une  autre  théorie.  Pour  lui,  le 
matériel  statistique  et  toutes  les  recherches  statistiques 
n'ont  pas  seulement  pour  but  de  faire  connaître  l'Etat  et 
les  conditions  dans  lesquelles  il  se  trouve.  Il  veut  que  l'on 
recueille  des  données  systématiquement  présentées-,  à  l'aide 
desquelles  on  puisse  trouver  l'explication  de  certains  phé- 
nomènes de  la  vie  humaine  et  indiquer  les  lois  qui  régissent 
ces  phénomènes.  Il  est  incontestable  que  cette  conception 
est  plus  élevée  et  plus  féconde  en  résultats  scientifiques 
que  celle  d 'Achenwall. 

17.  Nous  avons  vu  s'établir  un  double  courant  dans  la 
conception  de  la  statistique,  dans  le  but  qu'elle  poursuit, 
dans  les  matériaux  qu'elle  met  en  œuvre,  dans  la  forme  sous 
laquelle  elle  présente  ses  résultats.  L'école  de  Conring- 
Achenwall-Schlozer,  l'école  de  Grôttingen,  d'une  part,  pré- 
conise une  science  descriptive,  appliquée  aux  choses  remar- 
quables de  l'Etat,  visant  les  phénomènes  contemporains. 
L'autre  école,  celle  des  arithméticiens  politiques,  étend 
cette  notion  et  cet  objet,  a  recours  aux  données  numériques 
et  au  calcul,  recherche  les  rapprochements  numériques,  en 
tire  des  déductions,  que  ses  adversaires  estiment,  pour  le 
moins,  hasardeuses.  Les  deux  écoles  se  développèrent  simul- 
tanément, parallèlement,  mais  leur  antagonisme  ne  devait 
pas  tarder  à  se  révéler. 

Ce  serait  cependant  exagérer  que  de  dire  que  l'école  de 
Gottingen  repoussait  systématiquement  et  d'une  façon 
absolue  l'emploi  des  données  numériques  et  les  comparai- 
sons. Sous  ce  dernier  point  de  vue,  il  convient  de  men- 
tionner ici  le  procédé  comparatif  auquel  recourut  le  pre- 
mier, en  1758,  Antoine-Frédéric  Bùssching,  géographe  ré- 
puté, qui  entreprit  d'exposer  la  statistique  sous  forme  de 
rubriques  distinctes,  dans  lesquelles  les  éléments  de  même 
nature  se  trouvaient  groupés  pour  plusieurs  Etats.  C  'était 
un  perfectionnement  apporté  à  la  méthode  d 'Achenwall, 
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et  von  Schlozer  lui-même,  qui  s'était  constitué  le  gardien 
intraitable  des  traditions  de  son  maître  Achenwall,  ne  put 
s'empêcher  de  proclamer  excellente  cette  innovation.  La 
méthode  nouvelle  recruta  de  nombreux  imitateurs  au  début 
du  xixe  siècle,  mais  la  méthode  de  Bussching  est,  au  fond, 
la  même  que  celle  d 'Achenwall.  Elle  se  limite  toujours  aux 
considérations  sur  la  constitution,  la  force,  les  conditions 
matérielles  de  l'Etat  et  se  sert,  comme  le  fit  l'école  de 
Gottingen,  de-  la  méthode  d'exposition  de  la  science  his- 
torique. 

L'école  d 'Achenwall  n'avait  pas  rejeté  ex  professo  tout 
emploi  des  données  numériques.  Ses  tenants  se  rendaient 
compte  que,  sur  bien  des  points,  les  chiffres  parlaient  un 
langage  d'une  autre  précision  que  les  qualificatifs  les  mieux 
choisis.  Suffit-il  de  noter  qu'un  pays  produit  de  bons  vins, 
possède  de  belles  fabriques,  a  un  commerce  florissant  pour 
donner  au  lecteur  une  impression  exacte  de  ce  que  sont  ces 
produits  des  vignobles,  ces  manufactures,  ce  commerce! 
Von  Schlozer  reconnaissait  que  des  nombres  feraient  ici 
bien  mieux  l'affaire.  Il  écrivait  lui-même  :  «  Une  donnée 
peut  être  exacte  et  cependant  être,  somme  toute,  inutile  si 
on  ne  peut  l'exprimer  en  chiffres  ».  Mais  il  ne  s'agissait  pas 
pour  l'école  de  Gottingen  de  réduire  toute  la  statistique  à 
des  chiffres;  tout  au  plus  était-elle  disposée  à  admettre 
que,  pour  un  pays,  on  dressât  un  tableau  numérique  où  se 
trouveraient  quelques  résultats  importants. 
.  Cependant,  l'école  de  l'arithmétique  politique  avait  con- 
tinué à  se  développer  et  avait  trouvé,  en  Allemagne  même, 
d'assez  nombreux  adhérents  et  propagandistes.  Dès  l'année 
1741,  un  Danois,  P.  Anchersen,  avait  même  entrepris  de 
comparer,  au  moyen  de  tableaux  numériques,  les  conditions 
respectives  de  plusieurs  Etats,  procédé  que  l'école  de  Got- 
tingen ne  devait  imiter,  à  l'aide  de  ses  descriptions,  que 
quelques  aimées  plus  tard,  en  1758,  lors  de  la  publication 
du  livre  de  Bussching. 

Le  heurt  était  inévitable  entre  les  deux  écoles.  Les  fidèles 
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de  la  méthode  d'Achenwall  surtout  y  mirent  de  la  passion 
et  de  l'ironie.  Ils  reprochèrent  à  leurs  rivaux,  bientôt  deve- 
nus leurs  adversaires  irréductibles,  de  ravaler  la  statistique 
à  un  amas  confus  de  chiffres  sans  sécurité  et  sans  portée. 
Ils  les  appelaient  les  «  fabricateurs  de  chiffres,  les  esclaves 
des  chiffres  ».  Au  commencement  du  xixe  siècle,  la  querelle 
avait  atteint  des  proportions  épiques  en  Allemagne.  «  La 
statistique,  écrivaient  des  polémistes  qui  prenaient  le  parti 
de  l'école  de  Gottingen,  est  devenue  un  travail  insensé  uni- 
quement par  la  faute  des  arithméticiens  politiques.  Ces 
auteurs  croient  et  s'imaginent  faire  croire  que  les  res- 
sources d'un  Etat  peuvent  être  connues  en  sachant  unique- 
ment quel  est  le  nombre  de  milles  carrés  que  représente  le 
territoire  du  pays,  le  nombre  de  ses  habitants,  sa  popula- 
tion relative,  le  revenu  national,  etc.  » 

Aussi  l'œuvre  des  arithméticiens  politiques  leur  parais- 
sait-elle néfaste  :  elle  tendait,  disaient-ils,  à  réduire  la  sta- 
tistique à  l'état  de  squelette,  à  la  priver  de  vie  et  à  la 
dépouiller  de  sa  physionomie  propre.  Au  contraire,  l'école 
de  Gottingen  prétendait  conserver  à  la  statistique  les  cadres 
si  vastes  tracés  par  Achenwall  et  von  Schlozer,  qui  s'éten- 
daient à  bien  des  matières  que  les  chiffres  ne  pouvaient 
exprimer  et,  notamment,  à  des  questions  psychologiques  et 
politiques  que,  seule,  la  description  littéraire  pouvait  abor- 
der. Il  y  avait  une  part  de  vérité  dans  ces  critiques,  à  côté 
d'énormes  exagérations.  Il  était  exact  que  les  données 
numériques  auxquelles  les  arithméticiens  politiques  avaient 
recours  ne  présentaient  pas  toutes,  il  s'en  fallait  de  beau- 
coup, le  caractère  d'exactitude  qu'il  eût  été  désirable  de 
leur  voir  revêtir;  il  est  vrai  aussi  que  ces  données  étaient 
en  trop  petit  nombre  pour  prétendre  exprimer  l'aspect 
social  et  économique  d'un  pays.  Mais,  par  contre,  il  était 
injuste  de  décrier  des  efforts  qui  allaient  ouyrir  à  la  statis- 
tique une  voie  féconde.  Et  de  plus,  le  point  de  vue  auquel  se 
plaçait  l'école  de  Gottingen,  défendant  jalousement  la 
situation  qu'elle  avait  acquise  dans  l'enseignement  acadé- 
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mique,  était  faux.  Il  procédait  d'une  conception  erronée  du 
but  de  la  statistique  et  d'une  méconnaissance  des  moyens  d'y 
parvenir.  L'école  d'Achenwall  faisait  un  étrange  amalgame 
de  la  géographie,  de  l'histoire,  de  l'économie  politique, 
voire  de  la  morale  et  de  la  psychologie,  avec  la  statistique 
proprement  dite.  L'esprit  scientifique,  en  se  développant, 
devait  aboutir,  comme  il  aboutit  en  fait,  à  dissocier  ces  élé- 
ments disparates.  L'économie  politique  se  constitua  en 
science  autonome  avec  l 'œuvre  d 'Adam  Smith  :  <(  La  richesse 
des  nations  »  (1776)  ;  la  philosophie  développa  la  notion  de 
la  nature  et  de  la  fonction  de  l'Etat;  les  sciences  adminis- 
tratives occupèrent  une  place  à  part  dans  l'enseignement 
universitaire;  la  géographie  se  plaça  sur  son  véritable 
terrain  en  étudiant  spécialement  les  conditions  naturelles 
résultant  du  climat,  de  l'orographie,  de  la  géologie,  et  de 
l'ethnographie.  La  science  de  l'actuariat  adopta  comme 
base  les  mathématiques  et  ne  fit  plus  appel  à  la  statistique 
que  pour  lui  réclamer  des  éléments  de  travail.  Bref,  l'an- 
cienne statistique  descriptive  se  vit  privée  de  la  plupart 
des  domaines  sur  lesquels  elle  s'étendait  autrefois,  tandis 
que  la  statistique  numérique  n'était  pas  encore  arrivée  à 
un  état  de  développement  scientifique  qui  permît  d'en  faire 
l'objet  d'un  enseignement  académique.  Il  semblait  donc  que 
l'arrêt  du  développement  scientifique  de  la  statistique  était 
complet  et  définitif  et  que  la  scienee,  à  peine  née,  allait  dis- 
paraître. 

Mais  on  peut  appliquer  à  un  nouveau  venu  l'hémistiche 
que  Boileau  écrivait  à  propos  de  Malherbe,  et  dire  :  «  Enfin, 
Quetelet  vint...  ». 

18.  Lambert-Adolphe-Jacques  Quetelet,  né  à  Gand  le 
22  février  1796,  décédé  à  Bruxelles,  le  17  février  1874,  direc- 
teur de  l'Observatoire  royal  de  Bruxelles,  secrétaire  per- 
pétuel de  l'Académie  royale  de  Belgique,  président  de  la 
Commission  centrale  de  statistique  de  Belgique,  eut  une  vie 
d'une  telle  activité  scientifique  qu'il  faudrait  tout  un 
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volume  pour  la  retracer  (1).  Nous  avons  déjà  dit  notre 
intention  d'indiquer  quelques  sommets  seulement  parmi  la 
longue  chaîne  d'auteurs  qui  se  sont  appliqués  à  cette  dis- 
cipline, sans  élever  aucune  prétention  à  faire  l'histoire  de 
la  statistique,  histoire  à  laquelle  ont  été  consacrés  des 
travaux  spéciaux  d'une  grande  valeur.  Il  s'agit  uniquement 
de  spécifier  comment  un  certain  nombre  d'auteurs  enten- 
dirent la  statistique  et  de  montrer  en  quoi  ils  en  augmen- 
tèrent la  connaissance.  C'est  à  ce  point  de  vue  unique  que 
nous  nous  placerons  dans  ce  court  résumé  de  l'œuvre  de 
Quetelet,  laissant  de  côté  ses  théories  sur  la  mécanique 
sociale  et  sa  conception  de  l'homme  moyen  qui  exigeraient 
de  trop  longs  développements. 

Dans  ses  premiers  travaux,  Quetelet  ne  semble  pas  se 
former  de  la  statistique  une  opinion  très  différente  de  celle 
qui  était  courante  à  son  époque.  Dans  le  second  travail 
statistique  qu'il  fait  paraître,  les  «  Recherches  statistiques 
sur  le  Royaume  des  Pays-Bas  »,  ouvrage  qui  fut  publié  en 
1828,  Quetelet  écrit  que  la  statistique  est  l'anatomie  de  la 
société,  que  son  but  est  «  d'observer  les  modifications 
qu'éprouvent  les  différents  peuples  dans  leur  état  physique 
et  moral  et  de  chercher  d'en  pénétrer  les  motifs  »  (2).  Il 
convient  de  remarquer  cependant  que  cette  définition  ren- 
ferme l'idée  de  comparabilité  et  celle  de  la  recherche  des- 
causes. Or,  si  la  première  a  été  appliquée  par  Bussching,  la 
seconde,  celle  de  la  recherche  des  causes,  a  toujours  été 
étrangère  à  l'école  d'Achenwall,  qui  réservait  aux  sciences 
historiques  l'explication  des  faits  qu'elle  enregistrait.  'Sans 
aller  jusqu'à  dire  que  Quetelet  innove  et  est  en  avance  sur 


(1)  Cf.  Frank  H.  Hankins,  idolphe  Quetelet  as  statisticiwi  (Studies  in 
history,  économies  and  public  law  edited  by  tlie  Faoulty  of  political  science  of 
Columbia  University.  New- York,  Columbia  University,  1008).  Joseph  Lottin: 
Quetelet  statisticien  et  sociologue  (Bibliothèque  de  l'Institut  supérieur  de  phi- 
losophie de  l'Université  catholique  de  Louvain)  .  Louvain-Paris,  1912.  Cette 
étude  contient  la  bibliographie  de  Quetelet  et  la  liste  des  principaux  ouvrages 
sur  Quetelet. 

(2)  Quetelet,  op.  cit.,  p.  11,  «  Introduction  ».  Bruxelles,  Hayez.  1846. 
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son  temps  —  car  le  programme  de  l'école  de  Gottingen 
avait,  au  cours  des  années,  subi  de  nombreuses  modifica- 
tions —  il  est  bon  de  signaler  que  notre  auteur,  dès  le  début 
de  sa  carrière,  est  à  l'avant-garde. 

La  pensée  de  Quetelet  n'est  pas  toujours  facile  à  démêler 
parce  qu'il  lui  donne  souvent  une  expression  différente  et 
qui,  pour  le  fond,  ne  semble  pas  toujours  adéquatement  la 
même.  Il  faut  aussi,  parmi  ses  nombreux  écrits,  choic4r 
celui  qui  paraît  le  plus  convenable  pour  y  rechercher  les 
idées  de  l'auteur.  Or,  au  point  de  vue  où  nous  envisageons 
l'œuvre  de  Quetelet,  cet  ouvrage  nous  paraît  être  les 
«  Lettres  sur  la  théorie  des  probabilités  appliquées  aux 
sciences  morales  et  politiques  »  ;  d'abord  parce  que  Quetelet 
a  écrit  cette  œuvre  alors  qu  'il  était  dans  toute  la  force  de  son 
talent:  cet  ouvrage  a  été  commencé  en  1837,  l'auteur  avait 
alors  41  ans  ;  ensuite,  parce  que  les  «  Lettres  sur  la  théorie 
des  probabilités  »  renferment  une  série  systématique  de 
considérations  sur  la  statistique.  Quetelet  n'avait  pas, 
disait-il,  la  prétention  de  donner  un  traité  sur  cette  matière, 
il  s'est  simplement  borné  à  signaler  plusieurs  erreurs  dans 
lesquelles  les  auteurs  tombent  fréquemment,  et  à  jeter  en 
avant  quelques  idées  qui  lui  ont  paru  propres  à  éclaircir  la 
théorie (1).  Cela  n'empêche  que  l'exposé  fait  par  Quetelet 
présente  l'allure  systématique  d'un  exposé  doctrinal  où  il 
est  permis  de  chercher  l'expression  des  idées  de  l'auteur. 

19.  La  statistique,  d'après  Quetelet,  a  pour  sujet  l'Etat, 
c'est-à-dire  une  agrégation  d'hommes  possédant  un  terri- 
toire et  un  gouvernement  (2). 

Ce  n'est  pas  uniquement  la  société  politique  qui  est  à 
considérer,  mais  la  société  civile,  car  l'homme,  être  sociable, 
est  l'élément  essentiel  de  l'Etat  (3). 


(1)  Quetelet,  loc.  cit.,  «  Introduction  »,  p.  rv. 

(2)  Ibid.,  p.  260. 

(3)  Ibid.,  p.  260. 
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Faire  de  la  statistique,  c'est  considérer  un  Etat  pendant 
une  de  ses  phases  de  développement,  à  un  moment  donné, 
pour  reconnaître  son  organisation  avec  tout  ce  qui 
l'entoure  (%)_. 

La  définition  de  l'objet  de  la  statistique  est  la  suivante: 
«  Elle  ne  s'occupe  d'un  Etat  que  pour  une  époque  déter- 
minée; elle  ne  réunit  que  les  éléments  qui  se  rattachent  à  la 
vie  de  cet  Etat,  s'applique  à  les  rendre  comparables  et  les 
combine  de  la  façon  la  plus  avantageuse  pour  reconnaître 
tous  les  faits  qu'ils  peuvent  nous  révéler  »(2). 

Mais  quels  sont  les  éléments  qui  se  rattachent  à  la  vie  de 
l'Etat  ?  L'école  de  Gottingen  n'avait,  par  exemple,  attaché 
qu'une  importance  secondaire  aux  éléments  économiques, 
mais  une  grande  aux  éléments  politiques. 

Quetelet  envisage  la  vie  de  l'Etat  dans  le  sens  le  plus 
étendu.  D 'après  lui,  la  statistique  générale  cl  'un  Etat  com- 
prend essentiellement  les  cinq  divisions  suivantes  :  1°  la 
population;  2°  le  territoire;  3°  l'état  politique;  4"  l'état 
agricole,  industriel  et  commercial;  5°  l'état  intellectuel, 
moral  et  religieux.  La  population,  dit  Quetelet,  est  l'élément 
statistique  par  excellence  :  il  amène  nécessairement  tous  les 
autres,  puisqu'il  s'agit,  avant  tout,  du  peuple  et  de  l'appré- 
ciation de  son  bien-être  et  de  ses  besoins (3). 

L'homme  est  le  sujet  vrai  de  la  statistique.  Ainsi,  en 
traitant  du  territoire,  ou  de  l'agriculture,  ce  n'est  pas  la 
composition  du  sol  qu'il  faut  avoir  en  vue,  mais  seulement 
les  objets  qui  servent  aux  usages  de  l'homme,  soit  pour  être 
consommés  immédiatement,  soit  pour  être  utilisés  par  le 
commerce  et  l'industrie  (4). 

Si  l'on  s'occupe  des  animaux,  ce  n'est  que  pour  autant 
qu'ils  sont  utiles  ou  nuisibles  à  l'homme  (5). 


(1)  QCETELET,  loc.  Cit.,  p.  260 

(2)  Ibid.,  pp.  268-69. 

(3)  Ibid.,  p.  270. 

(4)  Ibid.,  p.  274. 

(5)  Ibid.,  p.  275. 
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Or,  ce  point  de  vue  est  essentiel,  car  il  permet  d'éviter 
l'écueil  qu'ont  rencontré  certains  statisticiens  qui  ont  trans- 
porté dans  la  statistique  d'autres  sciences  qui  lui  sont 
étrangères,  comme  la  géographie  physique,  la  minéralogie, 
la  botanique,  la  météorologie,  etc.  (1) 

Ces  éléments,  comment  peut-on  les  représenter  par  des 
chiffres  ou  par  une  description  littéraire  ?  C  'était  là,  on  se 
le  rappelle,  une  distinction  fondamentale  entre  la  doctrine 
des  arithméticiens  politiques  et  celle  de  l'école  de  Gottingen. 
Quetelet  se  montre  éclectique,  et  ici,  il  prévoit  clairement 
les  nécessités  de  la  statistique  dans  son  développement 
ultérieur.  Certains  auteurs,  dit-il,  au  lieu  d'étudier  la  statis- 
tique, sont  tombés  dans  le  travers  opposé  et  ont  voulu  la 
restreindre,  la  réduire  à  ne  présenter  que  des  tableaux 
purement  numériques,  sans  songer  qu'il  existe  des  rensei- 
gnements qu'il  serait  impossible  d'exprimer  en  nom- 
bres (2).  L'exposé  de  l'état  politique,  par  exemple,  appar- 
tient essentiellement  à  la  statistique  d'un  pays,  et  cependant 
on  ne  saurait  le  faire  connaître  par  des  chiffres.  On  peut  en 
dire  autant  de  beaucoup  de  renseignements  relatifs  à  l'état 
moral  et  intellectuel.  Le  simple  récit  de  ce  qui  s'est  passé 
dans  une  localité  à  une  époque  donnée  en  apprend  quelque- 
fois plus  sur  l'état  moral  d'un  peuple  que  tous  les-  tableaux 
numériques  possibles  (3). 

La  statistique  ne  se  confond-elle  pas  avec  l'histoire  et 
la  politique  ?  Non,  répond  Quetelet.  La  statistique  est  à 
l'histoire  «  ce  que,  dans  un  ordre  de  choses  différent,  la 
statique  est  à  la  dynamique,  ce  que  le  repos  est  au  mouve- 
ment »  (4).  Comment  ne  pas  se  souvenir  de  la  définition  de 
von  Schlozer  :  «  L'histoire  est  une  statistique  en  mouve- 
ment, la  statistique  est  une  histoire  en  repos  ».  Quetelet 


(1)  Quetelet,  loc.  cit.,  p.  275. 

(2)  Ibid.,  p.  275. 

(3)  Ibid.,  p.  276. 

(4)  Ibid.,  p.  261. 
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ajoute:  «  plus  généralement,  la  statistique  s'occupe  de 
l'instant  présent,  en  laissant  le  passé  à  l'histoire,  et  l'avenir 
à  la  politique  »  (1). 

Le  sujet  de  la  statistique,  a  dit  Quetelet,  c'est  l'Etat, 
c'est-à-dire  les  hommes  qui  composent  la  société  civile.  Tel 
est  le  domaine  propre  de  la  statistique.  Mais,  en  même 
temps,  Quetelet  fait  des  applications  constantes  des  pro- 
cédés statistiques  à  la  météorologie,  à  l'astronomie,  à  la 
botanique,  mais  il  distingue  soigneusement  de  la  statistique 
toutes  les  sciences  qui  lui  sont  étrangères.  C'est  donc  qu'il 
admet,  encore  qu'il  ne  l'ait  pas  expressément  formulée,  la 
distinction  entre  la  science  statistique  et  la  méthode  statis- 
tique. 

20.  L'influence  de  Quetelet  se  manifeste  dans  quatre 
domaines  importants,  à  propos:  1"  de  la  statistique  de  la 
population  ;  2"  de  la  statistique  morale  ;  3°  du  développement 
de  la  technique;  4°  de  l'application  de  la  loi  normale  des 
erreurs  aux  facultés  de  l'homme.  Peut-être  n'a-t-il  pas 
innové  complètement  en  aucune  de  ces  matières,  mais  en 
toutes  il  s'est  montré  original,  car  sa  conception  est  plus 
haute,  plus  claire,  plus  scientifique  que  celle  d'aucun  de  ses 
devanciers.  Quetelet  a  rendu  un  service  inappréciable  à  la 
science  en  combinant  harmonieusement  les  vues  des  arith- 
méticiens politiques  et  celles  de  l'école  d'Achenwall.  Il  est 
arrivé  à  une  époque  où  les  recherches  numériques  se  sont 
suffisamment  développées  pour  fournir  des  éléments  nom- 
breux et  divers.  Il  n'a  cessé  de  promouvoir  ces  recherches, 
d'en  perfectionner  la  technique,  de  recommander  l'emploi 
d'une  critique  judicieuse  et  attentive.  Dans  toutes  ses  in- 
vestigations, il  a  toujours  été  aidé  d'un  grand  bon  sens.  S'il 
«'est  servi  des  chiffres,  il  n'a  pas  été  leur  esclave  et  a  eu 
recours  à  toutes  les  ressources  de  l'analyse  logique.  Bref, 
il  a  donné  un  corps  à  une  foule  d'éléments  épars,  il  a  per- 


(1)  Quetelet,  loc.  cit.,  p.  261 


30 


PRINCIPES  DE  STATISTIQUE 


fectionné  toutes  les  matières  auxquelles  il  a  touché:  il  a 
constitué  la  statistique  moderne, 


II.  —  Diverses  opinions  en  présence. 

21.  D'après  les  diverses  conceptions  modernes,  à  quel 
sujet  s'attache  la  statistique,  qu 'est-elle  comme  objet  de  con- 
naissance scientifique,  quelles  sont  ses  limites,  quel  est  son 
contenu  logique  ?  Ce  sont  les  questions  que  Meitzen  pose 
comme  entrée  en  matière  à  l'un  de  ses  'Chapitres  les  plus 
remarquables  et  qu'à  notre  tour  nous  nous  posons  après 
la  revue  sommaire  qui  vient  d'être  faite. 

Un  premier  groupe  se  présente  à  nous  :  celui  d'Achenwall 
et  de  son  école.  Nous  faisons  abstraction  pour  le  moment 
de  son  éloignement  pour  la  donnée-chiffre,  qui,  du  reste, 
diminua  aVec  le  temps,  pour  ne  considérer  que  le  sujet 
attribué  par  cette  école  à  la  statistique.  Ce  sujet  est  l'Etat 
et  ses  propriétés  remarquables.  «  La  statistique  est  la  con- 
naissance approfondie  de  la  situation  respective  et  compa- 
rative de  chaque  Etat  »,  ou  encore:  «  l'ensemble  de  ce  qui 
est  réellement  remarquable  dans  un  Etat  et  en  forme  la 
constitution  dans  le  sens  général  forme  le  domaine  de  la 
statistique  ».  L'important  aux  yeux  d'Achenwall  et  de  ses 
successeurs,  c'est  de  préciser  le  sujet  des  observations  de  la 
statistique.  Les  questions  de  méthode,  pour  eux,  sont  acces- 
soires. L'influence  de  l'école  de  Gottingen  —  nous  l'avons 
dit  plus  haut  —  alla  en  diminuant,  mais  au  cours  de  la  pre- 
mière partie  du  xixe  siècle,  on  trouve  encore  des  auteurs  de 
talent  qui  font  abstraction  du  contenu  de  là  statistique  et 
de  son  essence,  pour  considérer  uniquement  le  sujet  de  ses 
études.  «  La  statistique,  écrit  Wappàus  en  1859,  doit  encore 
aujourd'hui  s'appuyer  sur  le  concept  d'Achenwall  si  elle  ne 
veut  pas  perdre  tout  à  fait  le  caractère  de  science  positive.  » 
D'après  cet  auteur,  la  statistique  n'a  pas  un  caractère  phi- 
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losophique,  c'est  une  science  positive  qui  comprend  un 
complexus  de  connaissances  subordonné  à  un  but  pra- 
tique précis.  Ce  but  est  la  connaissance  d'un  Etat 
déterminé,  concret,  tel  qu'il  est  dans  la  réalité.  La  statis- 
tique comprend  la  statistique  comparative,  laquelle  conduit 
à  une  statistique  scientifique  quand  elle  est  exprimée  en 
chiffres  pouvant  se  transformer  en  rapports,  etc.  La  statis- 
tique de  l'Etat  serait  la  statistique  spéciale.  L'autre  serait 
la  statistique  générale  comparée,  ayant  un  caractère  philo- 
sophico-mathématique. 

Dans  cette  conception,  ce  qui  importe  le  plus  à  la  statis- 
tique, c'est  l'Etat.  L'homme  n'est  pa.s  au  premier  plan,  il 
ne, vient  comme  sujet  d'étude  que,  parce  qu'il  est  partie  inté- 
grante et  agissante  dans  l'Etat.  La  statistique  alors  se 
range  parmi  les  sciences  politiques  et  administratives. 

22.  Mais  la  statistique  ne  devait  pas  tarder  à  élargir  ses 
frontières  traditionnelles.  Lorsque  Quetelet,  dans  ses  pre- 
miers travaux,  faisait  servir  la  statistique  à  déterminer  ce 
qu'il  y  a  de  normal  ou  de  plus  fréquent  parmi  les  caractères 
physiques  et  moraux  de  l'homme,  il  mettait  en  avant  un 
principe  fécond  dont  l'application  méthodique  devait  orien- 
ter la  statistique  vers  des  voies  nouvelles.  Les  mémoires- 
sur  les  lois  des  naissances  et  de  la  mortalité  à  Bruxelles 
(1825),  les  recherches  statistiques  sur  le  Royaume  des  Pays- 
Bas  (1828),  son  mémoire  sur  la  constance  qu'on  observe 
dans  le  nombre  des  crimes  qui  se  commettent  (1830),  les 
recherches  sur  la  loi  de  croissance  de  l'homme  (1831),  les 
études  sur  le  penchant  au  crime  aux  différents  âges 
(1831),  celles  sur  le  poids  de  l'homme  (1832),  préparaient 
les  deux  volumes  que  Quetelet  publia  en  1835  avec  le  titre: 
((  Sur  l'homme  et  le  développement  de  ses  facultés  ou  Essai 
de  physique  sociale  ».  En  montrant  que  la  loi  des  erreurs 
se  vérifiait  dans  les  qualités  physiques  et  morales  de 
l'homme,  Quetelet  ouvrait  un  vaste  champ  aux  recherches 
des  statisticiens  fatigués  de  se  cantonner  dans  les  elescrip- 
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tions  de  l'école  de  Gottingen,  dans  un  champ  de  recherches 
jalousement  borné  par  la  politique,  l'histoire,  la  géographie 
et  l'éthique.  En  même  temps,  ces  travaux  de  Quetelet  met- 
taient un  terme  à  la  vieille  controverse  entre  les  arithméti- 
ciens politiques  et  les  disciples  d'Achenwall,  car  si  les 
recherches  nouvelles  inaugurées  par  lui  étaient  impossibles 
sans  de  nombreuses  données  numériques,  elles  ne  pouvaient 
non  plus  avoir  de  signification  sans  les  commentaires  qui 
les  accompagnaient.  Ainsi  se  fusionnaient,  dans  une  concep- 
tion véritablement  scientifique,  les  prétentions  opposées  des 
deux  écoles.  Du  coup,  le  domaine  de  la  statistique  recevait 
une  extension  pour  ainsi  dire  illimitée,  en  même  temps  que 
l'enseignement  universitaire,  si  développé  en  Allemagne, 
prenait  une  direction  nouvelle. 

L 'orientation  donnée  à  la  statistique  prit  le  dessus  rapi- 
dement; au  milieu  du  xix*  siècle,  écrit  Meitzen,  elle  était 
devenue  générale. 

23.  Parmi  les  auteurs  qui  développaient  ce  point  de  vue, 
nous  en  choisissons  quelques-uns,  à  titre  d'exemple,  pour 
montrer  comment  la  statistique  est  comprise  par  ceux  qui 
adoptèrent  les  idées  émises  par  Quetelet  quant  à  l'objet  de 
la  statistique.  Lexis  considère  comme  appartenant  au  do- 
maine de  la  statistique  envisagée  comme  science,  toutes 
les  recherches  qui  se  rapportent  aux  faits  de  la  vie  hu- 
maine qui  peuvent  être  observés  au  moyen  du  relevé  en 
masse,  a  La  statistique,  dit-il,  a  pour  office  propre  de 
recueillir  et  d'étudier,  d'après  une  méthode  exacte,  les  faits 
de  la  vie  humaine,  pris  en  masse  et  de  cette  définition  il  suit 
déjà  que  la  base  de  la  méthode  consiste  dans  le  comptage 
des  cas  individuels  d'un  phénomène.  Elle  ne  considère  pas, 
comme  l'histoire,  l'individualité  des  événements,  mais  elle 
les  enregistre  seulement  comme  des  éléments  d'une  masse, 
comme  des  unités  d'un  total.  » 

Del  Vecchio  exprime  la  même  idée  sous  une  forme  con- 
cise :  «  La  statistique  moderne  est  une  science  positive,  dé- 
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terminée  par  son  objet,  qui  est  la  société  humaine  et  par  sa 
méthode,  qui  consiste  dans  l'observation  d  'une  quantité  de 
phénomènes  homogènes  et  sur  une  grande  échelle  ou  plus 
brièvement,  comme  disent  d'autres  définitions,  dans  l'ob- 
servation en  masse  ». 

Pour  von  Mayr,  le  domaine  de  la  statistique  scientifique 
comprend  l'étude  :  1"  des  masses  humaines  ;  2°  des  masses  de 
faits  humains  et  d'événements  sociaux;  3°  des  masses 
d'effets  d'actes  humains  et  d'événements. 

L'exposé  de  Rumelin  est  surtout  remarquable.  Il  importe 
cependant  de  faire  remarquer  que  dans  la  distinction  entre 
les  phénomènes  sociaux  et  naturels,  le  statisticien  allemand 
ne  faisait  que  reprendre  les  idées  émises  par  Dufau(l)  vingt- 
trois  ans  auparavant. 

Rumelin  part  de  ce  principe  que  «  le  particulier  est  typi- 
que dans  le  règne  naturel, individuel  dans  le  règne  humain». 
Comment  des  sciences,  qui  ont  pour  objet  le  règne  humain, 
pourront-elles  employer  la  voie  de  l'expérience  1  Tant 
qu'elles  restent  sur  le  terrain  des  observations  isolées,  soit 
du  présent,  soit  du  passé,  elles  ne  peuvent  guère  dépasser 
la  sagesse  des  proverbes.  Pour  leur  tenir  lieu  de  ces  instru- 
ments et  de  cette  épreuve  que  possèdent  les  sciences  du 
règne  de  la  nature,  il  faut  que  les  sciences  du  règne  humain 
en  arrivent  à  l'observation  méthodique  des  masses.  Celle-ci 
consiste  à  étendre  sur  des  groupes  entiers  d'individus 
comme  un  réseau  d'observations  qui  contemplent  et  enregis- 
trent, d'après  une  méthode  unique,  tous  les  phénomènes 
semblables.  De  là  une  science  auxiliaire  s'est  formée  qui  a 
pour  tâche  «  la  découverte  des  caractères  des  communautés 
humaines  par  l'observation  méthodique  et  le  calcul  des  phé- 
nomènes semblables  »  ;  et  par  communautés,  Rumelin 
entend  non  seulement  les  groupes  naturels  d'individus 
comme  les  peuples,  les  Etats,  les  provinces,  etc.,  mais  aussi 


(1)  Dufau,  Traite  de  statistique.  Paris,  1840. 
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tous  les  autres  cercles  d'activité  susceptibles  d'un  examen 
particulier,  comme  les  relations  politiques,  économiques, 
sociales,  religieuses,  etc.  (1).  Cette  science  auxiliaire  de 
toutes  les  science&  expérimentales  du  règne  humain,  c'est  la 
statistique. 

Ces  extraits  pourraient  être  multipliés  sans  autre  résul- 
tat que  de  lasser  le  lecteur  et  d'allonger  sans  utilité  cet 
exposé.  Tels  quels,  ils  suffisent  à  montrer  qu'au  cours 
du  xixc  siècle  la  statistique  a  conquis  un  ordre  de  choses 
nouveau  et  que  son  domaine  propre,  ce  n'est  plus  l'Etat  et 
ses  propriétés  remarquables,  mais  l'homme  lui-même,  ce 
qui  lui  assure  un  champ  d'action  autrement  vaste  et  inté- 
ressant. 

24.  Ce  que  nous  venons  de  dire  de  Rumelin  nous  fournit 
naturellement  l'occasion  de  passer  à  un  nouvel  exposé  : 
celui  des  vues  de  l'école  qui  considère  la  statistique  comme 
une  méthode  ou  plus  exactement  comme  une  des  sciences- 
de  la  méthode.  Rumelin,  on  l'a  vu  plus  haut,  base  son  argu- 
mentation sur  ce  point  essentiel  :  le  cosmos  ou  le  monde  se 
présente  à  nous  sous  deux  grandes  faces  :  le  règne  de  la 
nature  et  le  règne  humain.  Les  sciences  de  la  nature  comme 
les  sciences  de  l'homme  sont  des  sciences  expérimentales,  en 
ce  qu'elles  reposent  en  dernière  analyse  sur  l'induction  et 
l'observation,  peu  importe  d'ailleurs  que  le  procédé  déductif 
y  joue  aussi  plus  ou  moins  son  rôle.  Mais  ces  deux  grandes 
classes  de  sciences  n'en  sont  pas  moins  fort  différentes 
quant  à  leurs  moyens  d 'observation  scientifique. 

Les  progrès  des  sciences  naturelles  s'expliquent  par  ce 
fait  que,  dans  la  nature,  tout  cas  particulier  peut  servir  de 
type,  en  sorte  qu'un  seul  fait  bien  observé  autorise  déjà  une 


(1)  Rumelin,  Problèmes  d'économie  politique  et  de  statistique.  Trad.  franç. 
de  A.  de  Riedmatten.  Paris,  Guillaumin,  1806,  pp.  88-05. 
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induction,  et  qu'on  n'y  répète  d'ordinaire  l'observation  que 
pour  mieux  en  contrôler  l'exactitude  (1). 

Cette  thèse  de  Rumelin  a  rencontré,  sinon  des  contradic- 
tions absolues  —  ce  qui  paraîtrait  difficile  —  au  moins  des 
réserves.  Wagner,  dans  son  grand  article  Statistik,  a  fait 
remarquer  qu'entre  la  nature  et  l'homme  moral  il  n'y  a 
qu'une  différence  de  degré,  non  une  différence  principielle 
dans  le  système  des  causes.  Ce  système  est  plus  compliqué 
chez  l'homme,  et  dès  lors  il  sera  plus  difficile  de  le  démêler; 
mais  il  ressemble  au  système  des  causes  constantes  et  acci- 
dentelles, tel  qu'il  agit  dans  les  phénomènes  non  typiques 
de  la  nature. 

D'où  cette  conclusion  que  l'emploi  de  la  méthode  d'ob- 
servation de  la  masse  sera  moins  aisé  dans  le  premier  cas, 
mais  qu'il  est  nécessaire  dans  les  deux  (2). 

C'est,  par  réaction,  aller  trop  loin.  Rumelin,  dans  sa 
première  étude,  publiée  en  1863,  avait  déjà  pris  soin  d'ap- 
porter un  correctif  à  ce  que  son  af  firmation  pouvait  paraître 
avoir  de  trop  absolu.  «  Notre  assurance,  dit-il,  diminue  déjà 
quand  nous  passons  aux  plantes  et  aux  animaux  qui  subis- 
sent l'action  de  l'homme,  et  elle  s'évanouit  tout  à  fait  quand 
nous  entrons  dans  le  domaine  de  l'âme  humaine  (3).  » 

Dans  une  seconde  étude,  publiée  en  1874,  Rumelin  précise 
ses  vues  à  cet  égard  et  introduit  une  distinction  importante 
entre  la  statistique  et  la  méthode  statistique.  «  La  statis- 
tique, dit-il,  est  une  branche  des  sciences  sociales  et  on  doit 
la  considérer  comme  telle,  peu  importe  la  définition  qu'on 
en  donne.  Par  contre,  cette  méthode  particulière  de  recher- 
che, dont  le  trait  essentiel  est  de  compter  et  de  classer  la 
multitude  des  cas,  fut  bien  d'abord  mise  au  service  de  la 
statistique  et,  par  suite,  des  intérêts  de  l'Etat;  mais  elle 


(1)  Rumelin,  loc.  cit.,  pp.  86-87. 

(2)  Lottin,  loc.  cit.,  p  256. 

(3)  Rumelin,  Inc.  cil.,  p.  87. 
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n'en  est  pas  moins  dans  son  essence  et  ses  applications 
d'une  portée  beaucoup  plus  générale  nullement  limitée  à  ce 
cercle  d'observations.  Elle  a,  comme  toutes  les  formes  de 
méthode  scientifique,  sa  place  dans  la  logique.  »  (1) 

L'ancienne  logique  ne  connaissait  que  l'induction  par 
laquelle  elle  recherchait  les  qualités  qui  appartiennent 
constamment  à  tous  les  individus,  mais  elle  ne  savait  com- 
ment apprécier  scientifiquement  les  éléments  variables. 
Or,  la  méthode  statistique  a  pour  attribut  essentiel  de  pou- 
voir, par  l'observation  scientifique  et  le  calcul,  caractériser 
les  éléments  variables  des  objets  observés,  pour  les  élever 
au  rang  de  caractères  utiles  à  la  science.  Elle  révèle  que 
des  lois  régulières  gouvernent  aussi  ce  domaine  des  va- 
riables, qu'il  n'y  a  pas  ici  hasard  ou  arbitraire,  mais 
seulement  une  plus  grande  complexité  de  forces  et  de 
causes  (2). 

«  Et  cette  méthode,  continue  Rumelin,  peut  intervenir 
partout  où  les  phénomènes  observés  présentent  des-  va- 
riables, ce  qui  se  rencontre  dans  tous  les  règnes  de  la 
nature.  Partout  aussi  un  intérêt  scientifique  peut  se  rat- 
tacher à  cette  variabilité.  On  pourrait  compter  et  assortir 
utilement  suivant  leur  grosseur  et  leur  forme,  jusqu'à  des 
grains  de  sable,  et  l'on  ne  saurait  encore  prévoir  toute  l'im- 
portance qu'une  supputation  exacte  des  variables  peut 
acquérir  dans  les  sciences  naturelles  (3).  » 

25.  De  ce  que  la  statistique  apparaît,  sous  certain  aspect, 
comme  une  méthode,  faudrait-il  conclure  que  tout  ce  à  quoi 
elle  s'applique  comme  méthode  rentre  dans  le  domaine 
d'une  science  unique,  à  laquelle  on  donnerait  le  nom  de 
statistique?  Ce  serait  soutenir  une  opinion  fort  hasardée 
et  qui,  par  ses  conséquences,  confine  à  l'absurde. 


(1)  Rumelin,  loc.  cit.,  p.  135. 

(2)  Ibid.,  p.  136. 

(3)  Ibid.,  p.  137. 
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Portlock,  en  1838,  soutenait  cette  opinion  :  «  On  peut 
dire,  écrit-il,  que  le  «  statiste  »  est  celui  qui  recueille  des 
faits,  que  la  statistique  consiste  dans  les  faits  ou  les  données 
relatifs  à  toute  chose  ou  à  toute  science,  naturelle  ou  poli- 
tique; que  la  science  statistique  est  la  réunion  et  l'ordon- 
nancement de  ces  faits  (1).  » 

Cournot,  dominé  par  la  préoccupation  des  caractères  ma- 
thématiques de  la  statistique,  ne  pense  guère  autrement  : 
((  On  entend  principalement  par  statistique  (comme  l'in- 
dique l'étymologie)  le  recueil  des  faits  auxquels  donne  lieu 
l'agglomération  des  hommes  en  sociétés  politiques;  mais 
pour  nous,  le  mot  prendra  une  acception  plus  étendue.  Nous 
entendrons  par  statistique  la  science  qui  a  pour  objet  de 
recueillir  et  de  coordonner  des  faits  nombreux  dans  chaque 
espèce,  de  manière  à  obtenir  des  rapports  numériques  sensi- 
blement indépendants  des  anomalies  du  hasard,  et  qui  dé- 
notent l'existence  des  causes  régulières  dont  l'action  s'est 
combinée  avec  celle  des  causes  fortuites  (2).  » 

Nous  n'entrerons  pas  dans  le  détail  de  l'examen  de  cette 
théorie,  n'ayant  pas  ici  à  faire  l'histoire  des  doctrines. 
Notons  simplement  que  cette  méconnaissance  des  carac- 
tères de  la  méthode  et  de  la  science  contribua  malheureu- 
sement à  répandre  au  sujet  de  la  statistique  et  de  son  objet 
les  idées  les  plus  fausses.  C'est  à  elle  également  qu'il  faut 
imputer  les  innombrables  brocards  dont  la  statistique  fut 
l'objet  durant  de  longues  années. 

Des  vues  plus  sages  se  répandirent  par  la  suite,  notam- 
ment celle  qui  consiste  à  distinguer  clans  la  statistique  deux 
aspects  :  une  science  statistique  qui  s'applique  aux  phéno- 
mènes sociaux,  une  méthode  statistique  ayant  pour  objet 


(1)  An  addrcss  explanatory  of  the  objrcts  and  adxantages  of  statistical  en- 
quéries. Belfast,  1838. 

(2)  Cournot,  En-position  de  la  thcork  des  chances  et  des  probabilités. 
Paris,  1843,  p.  181 . 
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l'étude  des  phénomènes  variables,  applicable  aux  sciences 
naturelles  comme  aux  sciences  sociales. 

Cette  pensée  a  été  exprimée  clairement  par  von  Mayr, 
qui  propose  une  double  définition  :  celle  de  la  méthode 
statistique,  ou  statistique  au  sens  formel,  qui  est  l'obser- 
vation quantitative  numérique  complète  des  phénomènes 
sociaux  et  de  quelques  phénomènes  d'un  autre  ordre;  et 
ensuite  celle  de  la  science  de  la  statistique,  ou  statistique 
au  sens  matériel,  qui  consiste  en  l'explication  des  condi- 
tions et  des  phénomènes  de  la  vie  sociale,  qui,  comme  tels, 
se  manifestent  dans  les  masses  sociales,  explication  basée 
sur  une  observation  numérique  en  masse,  exprimée  en 
nombres  et  mesures. 

C'est  une  opinion  encore  fréquemment  admise  aujour- 
d'hui. 

Elle  donne  une  extension  nouvelle  à  la  notion  de  statis- 
tique :  celle-ci  devient  double  et  s'étend  non  seulement  aux 
communautés  humaines,  mais,  de  plus,  comme  méthode,  aux 
phénomènes  de  l'ordre  des  sciences  naturelles. 

26.  Cette  conception  double  —  méthode  et  science  —  pré- 
parait elle-même  une  évolution  de  la  pensée  scientifique 
quant  à  la  nature  de  la  statistique.  C'est  qu'on  pouvait  lui 
reprocher  divers  inconvénients.  Le  premier  était  de  scinder 
l'unité  de  la  science  :  la  statistique  apparaissait  tantôt 
comme  une  suite  de  raisonnements  tendant  à  l'explication 
de  phénomènes  d'une  importance  capitale,  c'est-à-dire 
comme  une  science  ayant  son  objet  et  son  but  propres, 
tantôt  comme  une  série  de  procédés  utiles,  sans  doute,  à  la 
connaissance  scientifique,  mais  dont  le  rôle,  surtout  dans 
les  sciences  naturelles,  restait  accessoire  et  inférieur, 
somme  toute,  à  l'induction. 

Etait-il  raisonnable,  d'autre  part,  de  désigner  sous  le 
même  nom  deux  disciplines  ayant  un  objet  distinct  et  un 
but  différent  :  la  statistique  —  science  expliquant  les  plié- 
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nomènes,  —  la  statistique  —  méthode  accumulant  seulement 
des  matériaux? 

Ou,  s'il  s'agissait  d'une  discipline  unique,  était-elle  philo- 
sophique, cette  conception  d'une  discipline  à  deux  faces  : 
science  quand  elle  envisageait  des  phénomènes  d'un  ordre 
donné,  méthode  quand  elle  considérait  d'autres  aspects  de 
l'univers? 

Les  logiciens  et  les  mathématiciens  se  sont  surtout  atta- 
chés à  considérer  la  statistique  méthodologique  et  ils  en  ont 
fait  une  branche  de  la  logique  appliquée. 

Un  logicien  allemand,  Sigwart,  a,  le  premier,  développé 
ce  point  de  vue  d'une  manière  complète.  Les  jugements, 
dit-il,  sont  basés  sur  des  perceptions  par  lesquelles  les  phé- 
nomènes sont  décrits  complètement  et  avec  précision  et 
situés  dans  le  temps  et  l'espace.  Là  où  cette  description 
n'est  pas  possible,  on  y  supplée  par  l'énumération  statis- 
tique des  phénomènes  semblables  en  se  basant  sur  la  classi- 
fication existante  des  objets  considérés.  La  description  des 
phénomènes  individuels  sert  à  les  inclure  dans  les  catégo- 
ries déjà  formées,  mais  par  là  on  renonce  à  la  description 
de  l'individuel  comme  tel,  car  il  est  confondu  dans  un 
groupe  d'unités  semblables.  Le  caractère  essentiel  des 
relevés  statistiques  consiste  en  ce  que  les  objet»  particuliers 
ne  sont  pas  énumérés  et  catalogués  comme  tels,  mais  qu  'ils 
constituent  ensemble  des  totaux  d'objets  et  de  phénomènes 
semblables,  en  confondant  les  perceptions  individuelles 
sous  des  rubriques  distinctes.  Ceci  constitue  la  statistique 
descriptive  qu'on  peut  considérer  comme  la  première 
phase  de  la  statistique  même.  La  seconde  phase  consiste 
dans  l'usage  des  résultats  ainsi  obtenus,  dans  le  but  de 
découvrir  une  loi. 

Pour  arriver  à  un  pareil  résultat,  on  a  recours  au  calcul 
sous  ses  différentes  formes.  Les  moyennes  montrent 
l'existence  de  régularités  empiriques;  elles  sont  descrip- 
tives de  leur  nature  et  sont  incapables  d'exprimer  une  con- 
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trainte  sans  cette  supposition  que  les  circonstances  qui 
produisent  les  cas  variables  sont  constantes  dans  leur 
ensemble.  Les  conclusions  statistiques  sur  la  causalité  sont 
fondées  sur  les  variations  des  nombres  et  non  sur  leur 
constance.  La  statistique  montre  que  les  causes,  connues 
par  ailleurs,  ont  exercé  leurs  effets,  qu'elles-  n'ont  pas  été 
annihilées  par  d'autres,  et  elle  donne  une  mesure  de  l'in- 
tensité de  chaque  force  agissante,  en  rapport  de  toutes 
les  autres.  Mais  il  est  impossible  à  la  statistique  de  prévoir 
et  de  dire  que  chaque  cas  individuel  qu'elle  englobe  dans- 
ses  énumérations  est  soumis  à  la  contrainte  de  la  loi. 
Lorsque  la  loi  est  trouvée,  l'analyse  et  la  méthode  inductive 
reprennent  leur  empire  et  la  méthode  statistique  perd  son 
intérêt. 

Le  statisticien  russe  Tchouprow  base  également  le  carac- 
tère logique  de  la  statistique  sur  la  nécessité  de  la  connais- 
sance de  l'individuel  et  sur  l'impossibilité  d'arriver  à  cette 
connaissance  autrement  que  par  le  moyen  de  la  méthode 
statistique.  Il  distingue  les  sciences  nomographiques  qui 
fournissent  les  comptes  généraux,  des  sciences  idéogra- 
phiques qui  complètent  les  notions  générales  au  moyen 
d'une  série  de  données  de  faits,  de  connaissances  concrètes, 
individuelles.  Les  sciences-  idéographiques  ne  pouvant  con- 
naître l'individuel  dans  toutes  ses  manifestations,  car  le 
problème  est  sans  limites,  doivent  recourir  à  un  procédé 
de  distribution  des  objets  entre  des  limites  relativement 
larges  de  temps  et  d'espace.  «  Combien  d'objets  d'un  genre 
déterminé  se  comptent  dans  des  limites  plus  ou  moins 
larges  de  temps  et  d'espace  »,  telle  est  la  question  fonda- 
mentale de  la  statistique,  science  idéographique,  procédant 
par  catégories.  On  renonce  donc  à  caractériser  les  faits 
isolés,  et,  au  contraire,  on  les  réunit  par  groupes,  ce  qui 
est  la  méthode  d'énumération  par  catégories  des  statisti- 
ciens. 

Nous  venons  de  voir  que  Sigwart  avait  aussi  trouvé  que 
le  caractère  essentiel  du  relevé  statistique  est  l'omission 
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des  caractères  individuels  ou  plutôt  leur  fusion  en  de  vastes 
catégories  ou  totaux. 

Une  telle  explication  fournit  une  notion  complète  de  la 
statistique  méthodologique  et  présente  la  statistique 
comme  une  application  de  la  logique,  coordonnée,  non 
subordonnée  à  l'induction. 

III.  —  La  statistique  est-elle  une  science  ou  une  méthode? 

27.  Ce  que  nous  avons  dit  précédemment  contient  une 
réponse  implicite  à  cette  question,  aussi  ne  faisons-nous 
plus  que  résumer  brièvement  notre  point  de  vue. 

La  notion  de  science  suppose  nécessairement  que  l'objet 
étudié  est  un.  Il  n'y  a  pas  de  science  universelle.  Ce  qui 
donne  à  la  science  son  unité,  c'est  son  objet  formel.  La 
définition  de  l'essence  d'une  chose  et  de  ses  propriétés 
donne  naissance  à  quelques  propositions  simples,  qui  con- 
duisent à  d'autres,  subordonnées  aux  principes,  de  sorte 
que  la  construction  scientifique  est  tout  entière  basée  sur 
les  principes  fournis  par  l'analyse  du  sujet  (1). 

Or,  l'objet  de  la  statistique  n'est  pas  un,  il  est  multiple. 
Il  y  a  la  statistique  des  faits  humains  et  la  statistique 
des  faits  de  l'ordre  naturel.  Il  y  a  la  statistique  des  nais- 
sances, des  décès,  des  mariages,  des  divorces,  des  délits  et 
des  crimes.  Il  y  a  la  statistique  des  quantités  d'eau  tombée, 
des  jours  de  gelée,  du  temps  pendant  lequel  le  soleil  a  brillé. 
Une  science  qui  s'étendrait  à  tous  ces  objets  à  la  fois  serait 
une  science  monstrueuse,  comme  Rumelin  l'a  fait  observer 
avec  sa  verve  habituelle  : 

«  Toute  classification  des  sciences,  écrit-il,  a  pour  prin- 
cipe la  ressemblance  et  la  différence  de  leurs  objets,  non  de 
leurs  moyens  logiques  d'étude. Tout  ce  que  la  méthode  statis- 
tique rassemble  chaque  jour  d'utile  pour  les  diverses  bran- 


(1)  Mercier,  Logique,  p.  271 
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ehe&  du  savoir  peut  aussi  peu  rentrer  dans  le  cadre  d'une 
seule  science  que  tout  ce  que  l'induction,  l'analogie  et  l'expé- 
rience découvrent  chaque  jour  dans  les  domaines  les  plus 
divers.  Ne  serait-ce  pas  une  science  monstrueuse  que  celle 
qui  prétendrait  embrasser  à  la  fois  les  isothermes  et  les 
isothères,  avec  les  résultats  de  l'élève  du  bétail  et  des 
remèdes  contre  la  fièvre;  les  tables  de  mortalité,  la  fré- 
quence des  meurtres  et  des  suicides  avec  les  bienfaits  so- 
ciaux des  différents  systèmes  agraires?  La  statistique  ne 
peut  absolument  pas  être  la  science  de  tout  ce  qui  se  peut 
conquérir  par  la  méthode  statistique  (1).  » 

28.  La  science  s'efforce  de  donner  une  explication  de& 
phénomènes.  Pourquoi  se  limiterait-elle  à  l'emploi,  dans 
ce  but,  d'une  méthode  unique?  Toute  méthode  qui  peut  con- 
duire à  la  découverte  de  la  vérité  doit  être  employée.  Sou- 
vent un  point  spécial  du  problème  qui  se  pose  exige  l 'emploi 
de  telle  méthode  ;  un  autre  point  ne  peut  être  étudié  à  moins 
que  le  savant  recoure  à  une  méthode  différente  de  la  pre- 
mière :  de  quel  droit  interdire  l'emploi  de  telle  forme 
d'investigation  scientifique?  Or,  la  statistique,  comme 
science,  n'aurait  à  sa  disposition  qu'une  méthode  unique  : 
la  méthode  statistique.  La  difficulté  serait  d'autant  plus 
grande  qu'il  s'agit  ici  de  l'étude  des  phénomènes  sociaux, 
qui  sont  les  plus  compliqués  de  tous.  Pour  trouver  l'expli- 
cation des  faits  les  plus  complexes-,  ceux  parmi  lesquels  on 
peut  démêler  l'intervention  des  causes  les  plus  diverses,  on 
se  trouverait  limité  à  l'emploi  d'une  seule  méthode!  Sans 
doute,  la  méthode  statistique  est,  à  l 'égard  des  phénomènes 
collectifs,  une  méthode  nécessaire  et  non  facultative,  mais 
de  ce  caractère  de  nécessité  on  ne  peut  conclure  à  celui 
d'unicité.  Or,  relisez  les  définitions  de  la  statistique  consi- 
dérée comme  science  :  «  Elle  consiste,  dit  von  Mayr,  en 
l'explication  des  conditions  et  des  phénomènes  de  la  vie 


(l)  Rumblin,  loc.  cit.,  p.  138. 
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sociale,  explication  basée  sur  une  observation  numérique 
en  masse,  exprimée  au  moyen  de  nombres  et  de  mesures.  » 
Il  y  a  donc  une  confusion  entre  la  science  et  la  méthode, 
qui  ne  forment  qu'un,  alors  que  l'on  considère  certains 
phénomènes;  au  contraire,  elles  se  disjoignent  lorsqu'on 
envisage  d'autres  faits;  conception  peu  logique,  à  coup  sûr, 
que  celle-là  !  / 

29.  Aussi,  nous  paraît-il  préférable  de  considérer  la  sta- 
tistique comme  une  méthode,  en  réservant  le  caractère  de 
nécessité  de  son  emploi  à  l'égard  des  phénomènes  collectifs 
et  plus  particulièrement  à  l 'égard  de  ceux  de  l 'ordre  social 
et  de  la  définir  : 

«  Une  méthode  qui,  par  le  relevé  en  masse  et  l'expression 
numérique  de  ses  résultats,  arrive  à  la  description  des  phé- 
nomènes collectifs  et  permet  de  reconnaître  ce  qu'ils  pré- 
sentent de  permanent  et  de  régulier  dans  leur  variété, 
comme  de  variable  dans  leur  apparente  uniformité.  » 

Sous  cet  aspect,  la  statistique  conserve  son  unité  logique. 
Partie  intégrante  de  la  démographie  et  de  la  sociologie 
criminelle,  elle  fournit  à  une  quantité  de  recherches  scienti- 
fiques l'appoint  nécessaire  de  ses  constatations  numé- 
riques et  de  ses  classifications. 

Mais  la  généralité  même  de  ses  applications,  comme  les 
propriétés  fondamentales  qui  expliquent  cette  généralité, 
lui  assignent  un  rang  particulier  parmi  les  méthodes  géné- 
rales, à  côté  de  l'induction  et  de  la  déduction.  Elle  est, 
comme  le  dit  excellemment  Lucien  March,  «  une  langue 
commune  pour  raisonner  sur  des  impressions  complexes, 
toutes  les  fois  que  ces  impressions  ne  se  fondent  point  en 
une  apparence  homogène  ».  Au  point  de  vue  de  son  contenu,- 
elle  est,  comme  le  dit  le  même  auteur,  «  la  science  des  faits 
considérés  comme  collectivités',  la  pléthométrie  (1)  ». 


(1)  Lucien  March,  «  Statistique  ».  dans  la  collection  Dr  la  Méthode  dam 
les  Sciences.  Paris,  Alcan,  1911. 
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CHAPITRE  III 
Caractères  propres  à  la  statistique 

I.  —  Les  caractères  de  régularité. 

30.  Devant  la  complexité  des  faits  qui  se  présentent  à 
elle  dans  le  domaine  des  sciences  sociales,  l'observation 
commune  est  impuissante  à  formuler  des  conclusions  pré- 
cises. Tous,  nous  savons  que  les  naissances  masculines  et 
féminines  se  produisent  en  nombre  à  peu  près  égal,  car  le 
bon  sens  nous  dit  que,  s'il  n'en  était  pas  ainsi,  on  verrait, 
au  bout  de  peu  de  temps,  un  sexe  représenté  par  un  nombre 
d'individus  beaucoup  plus  important  que  l'autre,  ce  qui, 
visiblement,  n'est  pas  exact.  Mais  à  cela  se  borne  la  pré- 
somption que  nous  pouvons  tirer  du  raisonnement;  dans 
ce  cas  même,  l'observation  commune  serait  de  nature  à  nous 
induire  en  erreur,  car,  dans  les  limites  où  elle  est  capable 
de  s'exercer,  elle  ne  nous  révélerait  rien  autre  chose  qu'une 
situation  chaotique  :  ici,  nous  verrions  prédominer  les  nais- 
sances masculines,  là  ce  seraient  les  naissances  féminines 
qui  l'emporteraient.  Au  total,  il  serait  impossible  de  rien 
affirmer  de  positif. 

Au  contraire,  l'observation  scientifique  éclaire  cette 
question  d'une  façon  saisissante.  Lorsque  les  observations 
sont  nombreuses,  on  voit  que  le  rapport  entre  les  naissances 
masculines  et  féminines  se  maintient  à  peu  près  exactement 
dans  la  proportion  de  105-106  garçons  pour  100  filles. 

La  proportion  est  un  peu  plus  faible  en  Belgique,  mais 
les  chiffres  conservent  leur  portée  instructive,  quel  que  soit 
le  rapport. 
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Pour  100  naissances  féminines,  nombre  de  naissances 
masculines  en  Belgique  : 


Périodes. 

Naissances  masculines. 
Légitimes.  Illégitimes. 

1841  — 1850   

.    .    .  105,48 

102,54 

1851  —  1860   

.    .    .  105.44 

102,53 

1861  —  1870   

.    .    .  105,39 

103,03 

1871  —  1880   

.    .    .  104,88 

102,37 

1881  —  1890   

.    .    .  104,63 

102,25 

1891  —  1000   

.    .    .  104,84 

102,72 

1901  —  1910  

.    .    .  104,61 

102,71 

L'observation  scientifique,  réalisée  par  la  méthode  statis- 
tique, montre  donc  qu'il  existe  des.  «  régularités  »  dans  un 
domaine  où  l'observation  commune  ne  peut  rien  nous  ré- 
véler de  semblable.  Les  recherches  anthropométriques,  qui 
ont  pris  tant  de  développement  au  cours  de  la  seconde 
moitié  du  xixe  siècle,  ont  permis  de  constater  un  grand 
nombre  de  régularités  analogues.  Ainsi,  la  stature  comparée 
des  hommes  et  des  femmes  a  fourni  d'intéressants  élé- 
ments de  discussion.  Des  études  statistiques  portant  sur  un 
nombre  élevé  d'individus,  ont  établi  que  l'homme  a  une 
stature  plus  élevée  que  la  femme  à  tous  les  âges,  sauf  à 
celui  de  la  puberté,  parce  que  la  femme  est  plus  tôt  nubile 
que  l'homme;  de  même,  on  a  remarqué  que  la  puberté  s'ac- 
compagne ou  est  suivie  immédiatement  d'une  forte  poussée 
de  croissance,  de  telle  sorte  que,  selon  l'expression  d'un 
auteur,  cette  période  de  la  vie  est  semblable  à  une  seconde 
naissance.  Certains  auteurs  ont  soutenu  que  la  tendance 
à  la  croissance  était  constante,  mais  qu'à  partir  de  certain 
âge,  35  ans  environ,  elle  était  annihilée  par  différentes  cir- 
constances anatomiques  et  physiologiques. Quoi  qu'il  en  soit, 
on  se  trouve  en  présence  de  régularités  que  la  méthode 
statistique  est  seule  à  même  de  faire  apparaître;  l'obser- 
vation commune  n'aurait  pu  fournir  à  la  science  les  élé- 
ments que  les  recherches  anthropométriques  ont  si  large- 
ment utilisés. 
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31.  Ce  qu'on  vient  de  dire  à  propos  de  la  stature  aux  dif- 
férents âges,  on  peut  le  répéter  à  propos  du  poids  du  corps,, 
de  l'ampleur  thoracique,  de  la  force  musculaire,  etc.  Or,, 
il  est  intéressant  de  remarquer  que  les  premiers  travaux 
de  Quetelet,  ceux  qu'il  fit  paraître  entre  1825  et  1835,  se 
rapportent  précisément  à  ces  questions  (v.  supra  n°  15)  et 
que  c'est  en  se  basant  sur  les  constatations  qu'il  avait  faites 
que  le  grand  statisticien  belge  prononce  pour  la  première 
fois  le  mot  de  «  loi  statistique  ».  «  L'homme,  écrit-il  dès. 
les  premières  lignes  de  son  Essai  de  physique  sociale,  publié 
en  1835,  l'homme  naît,  se  développe  et  meurt  d'après  cer- 
taines lois.  » 

Il  est  certain  que  Quetelet  n'a  pas  entendu  donner  à  ce 
mot  de  «  loi  »  le  sens  rigoureux  qu'on  y  attache  quand  on 
parle  de  lois  physiques.  Celles-ci  expriment  un  rapport 
général  et  constant,  mais  non  absolument  nécessaire,  en  ce 
sens  que  la  relation  entre  les  phénomènes  est  établie  entre 
des  variables  et  vérifiée  seulement  dans  les  limites  d'erreur 
des  expériences.  «  Les  lois  qui  s'appliquent  à  l'homme,  dit 
Quetelet,  par  la  manière  même  dont  on  les  a  déterminées, 
ne  présentent  plus  rien  d'individuel  :  toutes  les  applica- 
tions qu'on  voudrait  en  faire  à  un  homme  en  particulier 
sont  essentiellement  fausses;  de  même  que  si  l'on  préten- 
dait déterminer  l'époque  à  laquelle  une  personne  doit  mou- 
rir en  faisant  usage  des  tables  de  mortalité  (1).  »  La  dis- 
tinction entre  les  lois  physiques  et  les  lois  statistiques  appli- 
quées à  l'homme  est  explicite;  toutefois,  on  ne  pourrait 
affirmer  que  Quetelet  l'ait  toujours  maintenue  aussi  nette- 
ment; dans  un  bon  nombre  de  ses  écrits,  il  est  visiblement 
dominé  par  la  conception  mécaniste  qu'il  avait  puisée  dans 
son  initiation  aux  travaux  de  Laplace  et  de  Fourier.  Aussi, 
ne  faut -il  pas  s'étonner  si  quelques  statisticiens  ont,  à  sa 
suite,  affirmé  hardiment  qu'il  y  avait  dans  les  phénomènes 


(1)  Quetelet,  Sur  l'homme,  1835,  p.  14. 
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sociaux  comme  dans  les  phénomènes  de  l'ordre  physique, 
une  régularité  telle  qu'elle  pouvait,  dans  l'un  comme  dans 
l'autre  cas,  être  désignée  sous  le  nom  commun  de  «  loi  ». 
Dufau  n'a-t-il  pas  écrit  que  les  faits  du  monde  moral  ne  se 
comportent  pas  autrement  que  ceux  du  monde  physique? 
«  Une  étude  attentive,  ajoute-t-il,  montre  qu'ils  se  pro- 
duisent d'après  certaines  lois  fixes  et  invariables  qui  en 
règlent  la  succession  (1).  » 

Herschel,  qui  fut  lié  d'amitié  avec  Quetelet,  partage  les 
vues  de  celui-ci  et  Buckle,  fortement  inspiré  du  statisticien 
belge  dans  sa  conception  historique,  proclame  que  les 
actions  humaines  au  lieu  d'être  le  produit  du  hasard  ou 
l'effet  d'une  influence  surnaturelle,  sont  gouvernées  par 
des  lois  générales  en  regard  desquelles  la  liberté  hu- 
maine n'exerce  qu'une  influence  perturbatrice  insignifiante. 
Wagner,  à  son  tour,  considère  que  toute  la  théorie  de  la 
statistique  s'appuie  sur  la  conception  d'une  loi  causale 
générale.  C  'est  la  loi  universelle  des  phénomènes  qui  se  suc- 
cèdent l'un  à  l'autre  et  d'après  laquelle  tout  conséquent  a 
un  antécédent  immuable.  La  loi  du  phénomène  est  le  rap- 
port constant  entre  un  phénomène  comme  effet  (ou  comme 
conséquent  constant)  et  un  ou  plusieurs  phénomènes  qui  en 
sont  la  cause  (ou  antécédents  constants).  La  loi  indique 
l'uniformité  du  phénomène,  elle  montre  comment  la  cause 
domine  le  phénomène  d'une  façon  toujours  égale.  Trouver 
cet  état  de  dépendance  d 'un  phénomène  veut  dire  en  trouver 
la  loi. 

32.  Nous  n'entrerons  pas,  à  propos  de  cette  notion  de  loi, 
dans  la  discussion,  qui  s'amène  naturellement  à  la  suite,  de 
la  question  de  la  liberté  et  du  déterminisme  social.  L 'examen 
de  ce  point  n'entre  pas  dans  le  programme  des  notions 
préliminaires  que  nous  traitons  brièvement  ici,  non  plus 


(1)  Dukait,  De  la  méthode  d'observation  dans  ses  applications  aux  sciences 
morales  et  politiques.  Paris,  ]Sfi6. 
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que  dans  celui  de  la  statistique  méthodologique.  Aussi, 
parmi  les  objections  qui  furent  faites  à  la  conception  de 
«  loi  »,  ne  prenons-nous  que  celles  qui  visent  l'essence  du 
terme  même  et  non  pas  les  objections  qui  impliquent  la 
négation  du  déterminisme  social.  Rumelin,  avec  son  esprit 
critique  habituel,  a  bien  formulé  l'opinion  d'après  laquelle 
ie  terme  de  «  loi  »,  appliqué  aux  régularités  statistiques, 
aurait  en  réalité  une  portée  trop  vaste.  «  La  statistique, 
dit-il,  traite  la  notion  de  loi,  non  seulement  dans  un  sens 
inadmissible  pour  les  autres  sciences,  mais  elle  s'imagine 
même  pouvoir  construire  là-dessus  une  théorie  qui  lui  est 
propre.  »  La  «  loi  des  grands  nombres  »,  par  exemple,  est 
une  expression  malheureuse  aux  yeux  de  Rumelin.  Elle 
éveille  l'idée  qu'à  côté  des  lois  valables  pour  tous  les  cas, 
il  en  est  qui  ne  commanderaient  que  les  deux  tiers  ou  les 
trois  quarts  des  cas.  «  Or,  ajoute  Rumelin,  la  généralité  est 
pour  tout  penseur  méthodique  le  premier  et  le  plus  indis- 
pensable caractère  de  la  loi.  S'il  reste  un  cas  où  elle  est 
sans  effet,  bien  que  sa  formule  s'y  applique,  il  ne  lui  reste 
qu'à  conclure  que  sa  formule  est  fausse.  » 

Rumelin  montre  ensuite  que  la  statistique  peut  conduire 
à  la  découverte  de  lois  et  que  si  cette  méthode  n'est  pas  la 
seule  qui,  dans  le  domaine  des  faits  sociaux,  puisse  aboutir  à 
ce  résultat,  elle  est  néanmoins  une  des  plus  fécondes.  Tou- 
tefois, dit-il  encore,  la  loi  ainsi  conquise  n'aura  plus  qu'une 
forme  statistique  ou  simplement  numérique  :  mais,  comme 
toute  autre  loi,  elle  sera  générale  et  sans  exception.  Elle 
n'aura  plus  rien  à  faire  avec  le  grand  nombre,  sinon  que 
celui-ci  a  servi  à  la  découvrir  et  peut  encore  aider  à  la 
démontrer. 

Il  ajoute  encore  :  «  Il  semblerait  que  nombre  de  statis- 
ticiens, et  précisément  les  fondateurs  et  les  représentants 
de  l'école  la  plus  active  et  la  plus  méritante,  aient  oublié 
ces  échelons  naturels  d'une  étude  scientifique,  pour  attri- 
buer aussitôt  ce  caractère  suprême  de  loi  aux  degrés  préli- 
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minaires,  aux  simples  régularités,  aux  attributs,  aux  liai- 
sons causales.  » 

Après  avoir  rappelé  le  fait  de  la  prédominance  des  nais- 
sances masculines,  Rumelin  précise  encore  sa  pensée  en  di- 
sant :  «  Est-ce  à  dire  qu'il  y  ait  là  un  ordonnancement 
divin,  comme  le  pense  le  premier  inventeur  de  la  chose  (1), 
ou  même  une  loi  naturelle,  comme  disent  les  statisticiens 
modernes?  Ce  ne  sont,  en  réalité,  que  des  faits  encore  inex- 
pliqués pour  nous.  Ce  qui  nous  manque  ici,  c'est  bien  plutôt 
précisément  la  loi,  et  cette  loi  ne  peut  être  qu'une  loi  de  la 
généralisation,  à  découvrir  par  la  physiologie,  non  par  la 
statistique  (2).  » 

33.  A  côté  de  quelques  expressions  contestables,  cette 
thèse  de  Rumelin  paraît  renfermer  une  grande  partie  de 
vérité.  L'auteur,  par  réaction,  va  trop  loin  quand  il  dit  d'une 
manière  absolue  que  la  notion  de  loi  entraîne  toujours  avec 
elle  l'idée  d'une  liaison  constante  et  générale  des  phéno- 
mènes entre  eux.  Ce  caractère  de  rigueur  absolue  que  nous 
sommes  enclins  à  donner  aux  caractères  généraux  que  nous 
nommons  «  lois  »,  est  bien  plus  une  abstraction  de  l'esprit 
qu'une  réalité.  Ce  qu'on  a  pris  au  début  pour  des  lois 
immuables  a  été  reconnu  plus  tard,  lorsque  les  recherches 
méthodiques  ont  été  instituées  sur  un  plan  meilleur,  comme 
sujet  à  certaines  variations.  Etant  données  l 'infériorité  natu- 
relle de  nos  sens,  les  limites  de  notre  intelligence,  l'imper- 
fection des  instruments  dont  nous  nous  servons,  nous  ne 
pouvons  affirmer  avec  une  certitude  absolue  que  les  mani- 
festations d'un  phénomène  que  nous  considérons  comme 
semblables  soient  rigoureusement  et  absolument  les  mêmes. 
Personne  ne  parviendrait  à  démontrer  que  deux  objets 
sont  exactement  semblables,  parce  qu'on  peut  concevoir 


(  1  )   SlSSMII.CH  . 

(2)  Rumelin,  loc.  cit.,  pp.  15  à  19. 
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l 'énumération  de  leurs  qualités  individuelles  comme  attei- 
gnant l'infini  ou  du  moins  s 'étendant  à  un  nombre  tel 
que  pratiquement  on  ne  puisse  l'épuiser.  De  même,  les  ma- 
nifestations des  phénomènes  peuvent  varier,  par  des  points 
accessoires  que  nous  n'apercevons  pas.  Dans  notre  naïveté 
ou  notre  orgueil,  nous  nous  figurons  avoir  atteint  l'absolu. 

Au  contraire,  les  sciences  expérimentales  nous  enseignent 
que  beaucoup  de  manifestations  considérées  comme  uni- 
formes et  constantes,  sont  comprises  entre  des  limites  et 
agissent  comme  des  variables. 

Mais  Rumelin  a  raison  quand  il  s'élève  contre  l'abus 
qu'on  a  fait  en  statistique  —  et,  aurait-il  pu  ajouter,  en 
économie  politique  —  du  mot  «  loi  ».  Pour  saisir  l'erreur 
de  terminologie  dans  laquelle  beaucoup  de  statisticiens  ont 
versé,  il  faut  s'entendre  sur  la  portée  exacte  des  mots  et 
sur  la  classification  des  opérations  scientifiques. 

Lorsqu'une  vérité  est  connue  à  l'aide  d'un  raisonnement 
déductif  qui  montre  les  relations  existantes  entre  deux  ou 
plusieurs  phénomènes,  le  résultat  ainsi  obtenu  se  désigne 
sous  le  nom  de  théorème  ou  encore  d'hypothèse  scientifique. 
Les  vérités  démontrées  par  la  géométrie  ne  sont  pas  des  lois, 
mais  des  théorèmes.  On  ne  dit  pas  la  loi  du  carré  de  l'hypo- 
ténuse, mais  le  théorème  du  carré  de  l'hypoténuse. 

Au  contraire,  si  la  même  vérité  ne  pouvait  être  atteinte 
que  par  une  longue  suite  d'expérimentations  ou  d'observa- 
tions, au  lieu  d'être  déduite  par  le  raisonnement,  on  énon- 
cerait un  principe.  Si  entre  les  faits,  on  établissait  une 
relation  causale,  on  aurait  énoncé  une  loi. 

34.  Benini  fait  remarquer  avec  raison  qu'il  importe  de 
distinguer  entre  les  ((  lois  »  et  les  «  notions  empiriques 
concernant  l'uniformité  et  la  régularité  des  phénomènes  ». 
Savoir  que  telle  ou  telle  année  il  y  aura  des  éclipses  du 
soleil  ou  de  la  lune  est  une  notion  simple;  savoir  que,  à 
chaque  cycle  de  223  lunaisons  (18  ans,  11  jours,  7-8  heures), 
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on  a  une  répétition  assez  approximative  des  éclipses  pré- 
cédentes, signifie  qu'on  a  la  notion  empirique  d'une  uni- 
formité naturelle  ;  déterminer  enfin  les  antécédents  de  cette 
périodicité,  les  rapporter  aux  lois  de  la  mécanique  céleste, 
est  affirmer  une  loi. 

Or,  en  statistique,  on  a  souvent  attribué  avec  prodigalité 
le  nom  de  lois  à  de  simples  régularités  ou  uniformités  empi- 
riques, sans  que  l'on  ait  réuni  la  moindre  donnée  expli- 
cative relativement  aux  causes  qui  provoquent  cette  régu- 
larité ou  aux  circonstances  qui  tantôt  en  permettent  la  mani- 
festation, tantôt  l'empêchent  d'apparaître.  Supposons  qu'à 
l'aide  de  recherches  physiologiques,  on  ait  découvert,  comme 
on  l'a  prétendu  déjà,  que  tel  régime  alimentaire  appliqué 
aux  parents  aurait  pour  conséquence  de  provoquer  la  nais- 
sance d'enfants  mâles;  que  l'âge  des  époux  étant  dans  tel 
rapport,  on  aurait  chance  de  voir  des  naissances  féminines 
se  produire  en  plus  grand  nombre  que  des  masculines.  Sup- 
posons encore  que  ces  faits  aient  été  vérifiés  un  très  grand 
nombre  de  fois,  qu'en  y  appliquant  les  méthodes  inductives 
on  ait  reconnu  entre  eux  un  lien  causal  indiscutable,  alors 
on  serait  en  droit  de  donner  le  nom  de  lois  à  des  constata- 
tions de  l'espèce. 

35.  Mais  ces  conditions  ne  sont  pas  réalisées  dans  la  mé- 
thode statistique.  Ce  que  la  statistique  nous  livre,  c'est  une 
constatation  obtenue  à  l 'aide  d 'une  méthode  scientifique,  sans 
plus.  Elle  ne  nous  donne  aucune  explication  directe.  Elle  ne 
fait  immédiatement  ressortir  aucun  lien  causal  entre  les 
phénomènes.  Le  statisticien  nous  dit  :  J'ai  observé  un  grand 
nombre  de  naissances  au  point  de  vue  de  la  répartition  des 
sexes.  Je  puis  vous  affirmer  que  les  naissances  masculines 
sont  un  peu  plus  nombreuses  que  les  naissances  féminines, 
et  cela  dans  une  proportion  de  4-5  ou  5-6  p.  c. 

La  statistique  ne  nous  dit  pas  i  cet  excédent  des  naissances 
masculines  est  dû  à  telle  et  telle  cause.  Elle  constate  le 
fait.  Elle  énonce  une  régularité  de  la  nature,  mais  elle  ne 
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va  pas  plus  loin.  C'est  ajouter  au  sens  naturel  des  mots 
que  de  voir  dans  cette  constatation  une  loi.  Nous  connaî- 
trons la  loi  par  des  recherches  successives,  si  nous  arrivons 
jamais  à  la  connaître.  Ce  sera  peut-être  l'œuvre  d'un  phy- 
siologiste, ou  d'un  embryologiste,  mais  il  n'est  pas  à  pré- 
sumer que  ce  soit  celle  d'un  statisticien.  Peut-être,  dans  les 
recherches  qui  conduiraient  à  la  découverte  de  la  loi,  y 
aurait-il  lieu  de  recourir  à  la  méthode  statistique.  La  chose 
est  vraisemblable,  mais  elle  ne  fait  que  montrer  que  la 
statistique  est  avant  tout  une  méthode  scientifique  qui 
trouve  sa  place  dans  des  sciences  distinctes.  En  résumé, 
la  statistique  constate  des  régularités  naturelles  et  ne  dé- 
couvre pas  de  lois.  En  cela  elle  remplit  sa  fonction  de  mé- 
thode scientifique  et  le  rôle  qu'elle  joue  à  cet  égard  est  assez 
utile,  assez  glorieux  pourrait  on  dire,  pour  qu'il  ne  soit  pas 
besoin,  pour  en  renforcer  la  valeur,  de  détourner  les  mots 
de  leur  acception  véritable  et  de  nommer  loi  la  constatation 
de&  régularités  naturelles  par  le  procédé  statistique. 

S'il  fallait  encore  ajouter  quelque  chose  aux  arguments 
qui  viennent  d'être  exposés,  il  suffirait,  pour  emporter  la 
conviction,  de  faire  remarquer  que  les  tendances  et  les  régu- 
larités décorées  du  nom  de  «  lois  statistiques  »  n'ont  rien 
d'absolu,  ni  de  permanent.  Absolues,  ces  «  lois  »  ne  le  sont 
pas  dans  le  temps,  puisqu'elles  sont  sujettes  à  modifi- 
cations et  qu'elles  peuvent  même  cesser  de  se  manifester; 
elles  n'ont  rien  d'absolu  dans  l'espace  puisque  leurs  mani- 
festations varient  d'un  pays  à  un  autre,même  d'une  province 
à  une  autre  ;  elles  ne  sont  même  pas  absolues  à  un  moment 
donné,  dans  un  lieu  donné,  puisque,  pour  la  plupart,  elles 
varient  dans  leur  manière  d'être  selon  qu'elles  se  mani- 
festent dans  des  classes  sociales  différentes.  Les  constances 
statistiques  sont  purement  relatives;  résultant  d'une  action 
combinée  d'éléments  constants  et  variables,  elles  subissent 
les  influences  du  temps  et  du  lieu  où  on  les  observe  ;  vraies, 
à  un  moment,  pour  un  groupe  ;  elles  ne  le  sont  pas  pour  les 
individus  qui  composent  ce  groupe.  Ce  sont,  comme  dit  Ga- 
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baglio  (1),  des  lois  de  fait,  secondaires,  dérivées,  empiriques, 
comme  les  causes  desquelles  elles  résultent. 

II.  —  Notions  générales  sur  les  combinaisons  et  les  probabilités. 

36.  La  connaissance  scientifique  dans  son  expression  la 
plus  haute  pourrait  se  caractériser  par  un  mot  :  la  certi- 
tude, mais  ce  sommet,  que  nous  entrevoyons  dans  nos  rêves, 
n'est  pas  près  d'être  atteint.  Toute  connaissance  est  rela- 
tive; la  plus  complète  ne  fait  encore  que  réunir  un  certain 
nombre  —  élevé,  il  est  vrai,  —  de  probabilités.  N 'arrive-t-il 
pas  que  les  théories  les  plus  généralement  admises  sont  dé- 
racinées par  des  découvertes  nouvelles?  C'est  une  humi- 
liation que  nous  subissons  avec  patience;  elle  n'empêche 
pas  que,  sur  ces  données  nouvelles,  nous  construisions  une 
théorie  neuve,  car  le  besoin  de  synthétiser  en  un  corps  de 
doctrine  les  expériences  journalières  est  universel  et  impé- 
rissable. La  conviction  que  le  monde  n'est  pas  régi  par  des 
lois  aveugles,  l'espoir  de  découvrir  la  raison  des  phéno- 
mènes au  milieu  desquels  nous  vivons,  est  un  ressort  qui 
ne  s'use  pas.  Comme  le  dit  si  bien  M.  Emile  Boiel  :  «  Le 
jour  où  l'homme  a  compris  qu'il  pouvait  se  proposer  un 
tel  but,  il  ne  s'en  est  jamais  laissé  détourner;  même  dans 
les  périodes  les  plus  sombres  de  l'histoire,  lorsque  les  soucis 
de  la  vie  matérielle  absorbaient  presque  toutes  les  énergies, 
il  s'est  trouvé  des  chevaliers  servants  de  la  raison 
pour  conserver  et  transmettre  le  flambeau  de  la  pensée 
antique  (2).  » 

L'expérience  isolée  ne  peut  satisfaire  notre  soif  de  sa- 
voir. Nous  voulons  connaître  la  façon  dont  les  phénomènes 
s'enchaînent  et  s'ordonnent.  Eechercher  les  causes  des  phé- 
nomènes est  la  tâche  la  plus  essentielle  qui  s'impose  à  nous, 


(1)  Gabaguo,  loc.  cit  ,  p.  384. 

(2)  Emile  Borel,  Le  Hasard,  p.  4.  Paris.  Alcan,  1914. 
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car  si  nous  connaissions,  par  impossible,  les  causes  de  tous 
les  phénomènes,  nous  connaîtrions,  du  même  coup,  toutes  les 
circonstances  de  leur  répétition  éventuelle,  en  quelque  sorte 
nous  connaîtrions  l'avenir.  Il  importe  peu  que  la  raison 
nous  dise  qu'un  tel  rêve  est  vain.  Il  y  a  une  telle  distance 
entre  cette  connaissance  générale  et  absolue  et  la  relativité 
autant  que  la  petitesse  de  notre  savoir,  qu'on  peut  toujours 
essayer  de  gravir  un  échelon.  D'ailleurs,  un  progrès  en 
appelle  un  autre,  aucune  connaissance  positive  ajoutée  à 
notre  bagage  intellectuel  n'est  sans  utilité  pour  la  conquête 
d'une  notion  nouvelle  qui,  auparavant,  nous  paraissait  bien 
chimérique.  C'est  une  loi  de  la  science  qu'une  connaissance 
nouvelle  en  appelle  invinciblement  une  autre.  Pas  à  pas, 
nous  nous  acheminons- vers  le  bat  :  qu'importe  qu'il  soit 
encore  lointain,  si  nous  nous  en  rapprochons? 

37.  Nous  avons  dit  plus  haut  ce  qu'il  fallait  entendre  par 
a  loi  statistique  »  et  nous  avons  montré  qu'il  s'agissait  de 
désigner  sous  ce  nom  des  régularités  constatées  parmi  les 
phénomènes.  L'explication  causale  est  absente  de  cette  con- 
ception, mais  rien  que  la  découverte  de  la  régularité  est 
précieuse  parce  qu'elle  met  le  penseur  sur  la  piste  de  l'ex- 
plication causale.  A  l'aide  des  méthodes  d'analyse,  le  cher- 
cheur parviendra  peut-être  à  isoler  les  causes  constantes 
des  causes  accidentelles  et  alors  il  se  trouvera  sur  le  che- 
min qui  conduit  à  l'explication  finale;  même  réduite  à  ces 
proportions  relativement  modestes,  la  recherche  scien- 
tifique n'en  renferme  pas  moins  une  difficulté  redoutable. 

La  complexité  du  monde  et  de  la  vie  est  inimaginable. 
Elle  fait  d'ailleurs  partie  de  leur  nature  intime.  L'immo- 
bilité complète  n'évoque  chez  nous  que  l'idée  de  la  mort. 
La  vie,  c'est  le  mouvement,  c'est  le  changement,  c'est  la 
variété,  c'est  la  complexité.  Les  causes  s'enchaînent  et 
s'entre-croisent,  elles  se  multiplient  par  leurs  actions  réci- 
proques. Comment  faire  pour  les  classer,  pour  les  dénom- 
brer? Car  avant  de  connaître  les  phénomènes  probables 
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nous  devons  prendre  conscience  des  phénomènes  possibles. 
C'est  la  raison  pour  laquelle,  avant  d'esquisser  la  notion 
de  la  «  probabilité  statistique  »,  nous  devons  aborder  en 
peu  de  mots  les  éléments  du  calcul  des  combinaisons  et  des 
permutations. 

38.  Entre  plusieurs  objets  que  nous  observons,  il  peut 
exister  des  arrangements,  se  présenter  des  changements, 
s'imaginer  des  combinaisons  extraordinairement  nom- 
breuses et  variées. 

On  appelle  «  analyse  combinatoire  »  cette  partie  des 
mathématiques  qui  a  pour  but  d'énumérer  les  différentes 
manières  dont  on  peut  ranger  des  objets  donnés  dans  des  cir- 
constances déterminées.  Les  cas  les  plus  simples  de  l'ana- 
lyse combinatoire  consistent  en  ce  qu'on  appelle  :  A,  les 
arrangements;  B,  les  permutations;  C,  les  combinaisons. 
Comme  le  fait  justement  observer  Stanley  Jevons,  le  calcul 
combinatoire  est  une  des  parties  les  plus  curieuses  des 
mathématiques  ;  les  formes  des  expressions  algébriques  sont 
déterminées  par  les  principes  des  combinaisons,  et  les  opé- 
rations fondamentales  du  calcul  des  probabilités  ne  dif- 
fèrent pas  de  celles  de  l'analyse  combinatoire.  Les  nombres 
pour  ainsi  dire  infinis,  en  tout  cas  inexprimables,  auxquels 
on  arrive  rapidement  dans  les  permutations,  ont  été  de  tout 
temps  un  objet  de  curiosité  et  d'étonnement.  Pascal  et 
Leibniz  se  sont  appliqués  avec  passion  au  calcul  des  per- 
mutations et  des  combinaisons,  qui  a  été  également  un  sujet 
d'études  auquel  Jacques  Bernouilli  consacra  une  partie  de 
son  existence.  Dans  les  lignes  qui  suivent  nous  ne  nous  occu- 
pons que  des  arrangements,  permutations  et  combinaisons 
sans  répétition.  Aussi  bien  il  existe  des  arrangements,  per- 
mutations et  combinaisons  avec  répétition,  c'est-à-dire  dans 
lesquels  les  mêmes  objets  sont  répétés  identiquement. 

39.  On  appelle  arrangements  les  modifications  que  l'on 
fait  subir  à  un  certain  nombre  d'objets,  au  point  de  vue  de 
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leur  ordonnancement,  de  manière  à  former  des  groupes  de 
n  an  objets  parmi  m  objets' donnés.  Le  symbole  sous  lequel 
on  désigne  les  arrangements  est  A  m  »  et  la  formule  du 
calcul  est  : 

A  m  n  =  m  (m  —  1)  (m  —  2)  (m  —  3)  (m  —  n  +  1),  (1) 

formule  qui  peut  se  traduire  par  la  règle  :  le  nombre  des 
cléments  à  disposer  est  multiplié  successivement  par  ce 
nombre  diminué  chaque  fois  d'une  unité  et  cela  autant  de 
fois  qu'il  y  a  d'unités  de  la  classe.  Il  faut  et  il  suffit 
qu'aucun  groupe  ainsi  formé  ne  soit  identique  à  un  autre, 
soit  par  la  nature  des  éléments  qu'il  comprend,  soit  par 
l'ordre  dans  lequel  ces  éléments  sont  énumérés.  Ainsi  : 
D  E  F,  lettres  prises  sur  un  ensemble  de  6  lettres,  con- 
stituent un  groupe  différent  de  A  B  C,  mais  C  B  A  forment 
aussi  un  groupe  différent  de  A  B  C. 

Soit  l'exemple  suivant  :  une  maîtresse  de  maison  rece- 
vant chez  elle  vingt  invités,  veut,  après  une  soirée  musicale, 
leur  offrir  à  souper  par  «  petites  tables  »  de  quatre  per- 
sonnes chacune.  Combien  d'arrangements  pourra-t-elle 
imaginer  pour  faire  varier  la  composition  des  tables  et 
l'ordre  dans  lequel  les  vingt  invités  pourront  se  placer? 
Nous  avons  : 

A  20,4  -  20  .  19  .  18  .  17  =Jg^»r.  lù<* 

Supposons  maintenant  que  quatre  personnes  de  la  maison 
prennent  place  avec  les  vingt  invités  et  que-  les  arrange- 
ments possibles  soient  calculés  sur  l'ensemble  de  24  per- 
sonnes, on  a  : 

A  24,4  =  24  .  23  .  22  .  21  =  234,024. 

On  voit  par  là  que  le  fait  d'ajouter  un  petit  nombre 
d'unités  à  un  nombre  primitivement  choisi  a  pour  consé- 
quence d'augmenter  prodigieusement  le  nombre  d'arrange- 
ments possibles. 
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Ainsi,  si  au  lieu  de  24  personnes,  nous  prenons  pour 
exemple  les  26  lettres  de  l'alphabet  rangées  quatre  par 
quatre,  nous  avons  : 

A  26,4  =  26  .  25  .  24  .  23  =  358,800. 

40.  Si  le  nombre  d'arrangements  divers  que  l'on  peut 
obtenir  entre  un  nombre  relativement  peu  élevé  de  choses 
différentes  est  un  sujet  d'étonnement,  que  faudrait-il  dire 
des  nombres  auxquels  on  arrive  dans  le  calcul  des  permu- 
tations ? 

Le  symbole  des  permutations  est  P  n  et  la  formule  du 
calcul  à  opérer  est  : 

P  n  =  1  .  2  .  3  .  .  .  .     n.  (2) 

On  donne  le  nom  de  permutations  au  nombre  de  manières 
dont  on  peut  ranger  n  objets,  ou  encore  au  nombre  de 
groupes  différents  que  l'on  peut  former  en  les  rangeant 
successivement,  dans  des  ordres  différents. 

Dans  les  permutations  les  groupements  constitués  con- 
tiennent tous  les  mêmes  éléments,  mais  chaque  groupement 
est  considéré  comme  différent  d'un  autre  du  moment  que 
les  éléments  qu'il  contient  sont  rangés  dans  un  ordre  qui  n'a 
pas  encore  été  réalisé.  Le  nombre  de  n  éléments  est  donc 
égal  au  produit  des  n  nombres  entiers.  Remplaçons  n  par 
-un  chiffre,  nous  avons  : 

P  8  :=  1  .  2  .  3  *  4  .5,  6.7.8  =  40,320. 

Supposons  que  nous  ayons  à  présenter  à  un  haut  per- 
sonnage dix  personnes  entre  lesquelles  ne  se  marque 
aucune  distinction  essentielle,  de  façon  que  l'ordre  de  pré- 
sentation puisse  être  indifféremment  modifié.  Nous  avons  : 

P 10  =  1  .2.3.4.5.6.7.8    9.  10  =  3,628,800. 

Si  le  nombre  de  ces  personnes  atteignait  le  chiffre  de  12,. 
nous  atteindrions  le  chiffre  de  479  millions. 
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On  appelle  factorielle  le  produit  de  facteurs  en  progres- 
sion arithmétique,  donc  le  produit  de  tous  les  nombres 
entiers  depuis  l'unité  jusqu'à  la  valeur  n  exprimée  dans 
le  symbole  P  n.  Les  factorielles  ont  été  calculées  pour  un 
certain  nombre  de  chiffres.  Voici  celles  qui  comprennent  les 
12  premiers  nombres  : 
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39.916.800 

|  11 

479.001.600 
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41.  Il  importe  de  ne  pas  confondre  les  permutations  dont 
nous  venons  de  parler  et  les-  combinaisons  auxquelles  est 
consacré  le  présent  numéro.  Il  ne  faut  pas  confondre  non 
plus  les  combinaisons  avec  les  arrangements.  A.  cette  fin, 
reprenons  l'exemple  que  nous  avons  donné  sous  le  n°  39 
en  parlant  des  arrangements. 

Une  maîtresse  de  maison,  avons-nous  dit,  ayant  à  placer 
vingt  invités,  par  «  petites  tables  »  de  quatre  personnes  et 
voulant,  à  la  fois,  déterminer  la  composition  de  chaque  table 
et  la  place  que  chacun  y  occupera,  a  le  choix  entre 
85,680  façons  différentes  de  ranger  son  monde. 

Le  procédé  auquel  elle  a  eu  recours  pour  déterminer  ce 
chiffre  est  celui  donné  par  la  formule  des  arrangements  : 

A  20,4  =  20  .  19  .  18  .  17  =  85,680. 

Mais  l'énormité  même  du  nombre  de  manières  dont  il  est 
possible  de  disposer  les  vingt  invités  constitue  une  diffi- 
culté pratique.  La  maîtresse  de  maison  se  préoccupe  alors 
de  simplifier  les  données  du  problème  et  se  dit  qu'il  serait 
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bien  suffisant  que  la  composition  des  tables  soit  arrêtée  à 
l'avance  sans  qu'on  se  préoccupe  de  fixer  la  place  que 
chacun  des  quatre  invités  occupera  à  cette  table  :  nous 
sommes  ici  dans  le  cas  des  combinaisons. 

On  appelle  combinaisons  de  m  objets  pris  n  à  n  les 
groupes  que  l'on  peut  former  en  prenant  n  objets  parmi  ces 
m  objets  donnés,  de  manière  à  ce  que  deux  groupes  diffèrent 
par  la  nature  des  objets  qui  servent  à  les  former.  Dans  les- 
arrangements,  la  place  des  objets  intervient  en  même  temps 
que  leur  nature.  On  peut  encore  dire  que  «  les  combinaisons 
sont  des  groupements  que  l'on  peut  former  entre  plu- 
sieurs (m)  éléments,  pris  deux  à  deux,  trois  à  trois,  ou  en 
un  nombre  quelconque  ne  dépassant  pas  n,  à  condition  que 
chaque  groupe  contienne  au  moins  un  élément  autre  que 
dans  les  autres  groupes. 

A  m. 11     -Cm  11  m(m  —  1)  ....(m  —  n  +  \) 
Cm,  n  =  v>  ou  :  ~ — rr  — ■  (3) 

Le  problème  que  notre  maîtresse  de  maison  a  à  résoudre 
est  donc  le  suivant  : 

Il  y  a  donc  3,570  combinaisons  de  table  différentes  au 
lieu  de  85,680  comme  dans  le  cas  précédent,  ce  qui  est  encore 
bien  suffisant  à  créer  des  maux  de  tête  à  notre  maîtresse  de 
maison;  aussi  est-il  probable  qu'elle  se  résoudra  à  laisser 
ses  invités  se  grouper  eux-mêmes  d'après  leurs  goûts  et 
leurs  sympathies,  et  ce  sera  pour  un  mieux. 

Si,  au  lieu  de  faire  des  tables  de  quatre,  on  arrangeait 
des  tables  de  trois,  il  n'y  aurait  que  840  combinaisons  pos- 
sibles et  si  l'on  voulait  organiser  des  tête-à-tête,  il  n'y  en 
aurait  que  140  possibles,  car  : 

C.  ,0.3  .«d^J^.wo 

ou 

20  .  19  280 
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42.  Les  différences  numériques  qui  se  remarquent  dans 
les  résultats  des  arrangements,  permutations  et  combinai- 
sons sont  considérables.  La  raison  de  ces  différences  est 
facile  à  apercevoir.  Dans  les  permutations,  nous  envisa- 
geons tous  les  éléments  et  tous  les  changements  possibles 
entre  ces  éléments  ;  les  permutations  sont  des  énumérations 
complètes  de  tous  les  cas  possibles,  chaque  cas  ne  différant 
d'un  autre  que  par  la  place  qu'il  occupe.  C'est  donc  comme 
si  l'on  écrivait  toute  la  série  autant  de  fois  qu'on  pourrait 
le  faire  à  la  condition  unique  qu'aucune  des  énumérations 
ne  soit  rigoureusement  identique  à  ,-une  précédente.  On 
arrive  de  la  sorte,  et  très  rapidement,  à  des  nombres  incom- 
mensurables parce  que  chaque  produit  partiel  est  multiplié 
par  un  facteur  supérieur  d'une  unité  au  précédent.  Nous 
avons  dit  que  la  factorielle  de  12  est  déjà  479,001,600.  Les 
logarithmes  des  factorielles  jusqu'à  265  ont  été  publiés 
par  une  association  scientifique  anglaise,  la  «  Society  for 
the  diffusion  of  the  Useful  Knowledge  »  ;  pour  exprimer 
en  chiffres  une  factorielle  de  cette  importance,  il  faudrait 
utiliser  529  chiffres. 

Dans  les  arrangements,  au  contraire,  l'accroissement  des 
données  numériques  est  limité  par  le  nombre  des  choses  que 
l'on  considère  en  même  temps,  soit  deux  à  deux,  trois  à 
trois,  quatre  à  quatre.  Partant  du  nombre  le  plus  élevé,  on 
diminue  les  facteurs  successifs  chaque  fois  d'une  unité.  On 
atteindrait  des  nombres  aussi  élevés  que  dans  les  permu- 
tations dans  une  hypothèse  seulement  :  celle  où  l'on  arran- 
gerait les  objets  considérés  sous  un  nombre  d'unités  de  la 
classe  égal  au  nombre  total  des  termes,  mais  alors  on  serait 
dans  le  cas  des  permutations  et  non  plus  des  arrangements. 

Toute  combinaison  est,  dans  sa  nature  intime,  toujours 
différente  d'une  autre  combinaison,  car  un  des  éléments 
qui  en  faisait  partie  cède  sa  place  à  un  autre  :  nous  avons 
déjà  dit  que  sont  exclus  les  groupes  qui  contiennent  les 
mêmes  éléments  mais  en  ordre  divers,  hypothèse  qui  fait 
partie,  au  contraire,  des  arrangements  et  des  permutations. 
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Il  est  donc  naturel  que  les  combinaisons  soient  le  mode 
d'énumération  qui  contient  les  éléments  les  moins  nom- 
breux. 

On  a  aussi  fait  remarquer  que  l'ajoute  d'un  seul  élément 
aux  arrangements,  permutations  et  combinaisons  augmente 
les  nombres  dans  une  proportion  bien  plus  élevée  qu'on  ne 
pourrait  s'y  attendre  à  première  vue.  Ce  fait  résulte  de 
l'addition  d'un  facteur  nouveau  qui  multiplie  tous  les 
autres. 

Dans  les  permutations,  le  dernier  facteur  est  toujours 
supérieur  d'une  unité  au  précédent. 
Ainsi,  nous  avons  : 

P?i  6  =  1.  2.  3.  4.  0.6  =  720 

et 

P  n  7  =  1  .  2  .  3  .  4 :  .  S  .  6  .  7  =  5040. 

Dans  les  arrangements,  chaque  facteur  nouveau  diminue 
d'une  unité  seulement  par  rapport  au  précédent  et  il  mul- 
tiplie tous  les  produits  antérieurs  à  son  introduction. 

A  90,3  -  90  .  89  .  88  =  704,880. 
A  90,4  -  90  .  89  .  88  .  87  =  61,324,560. 

La  somme  obtenue  dans  le  cas  de  A  90,  4  est  donc  87  fois 
plus  élevée  que  dans  le  cas  de  A  90,  3. 

Il  suffit  de  se  reporter  à  ces  exemples  pour  se  faire  une 
idée  de  la  complexité  des  phénomènes  naturels  dans  lesquels 
plusieurs  facteurs  se  combinent. 

43.  La  construction  du  triangle  arithmétique,  appelé 
aussi  triangle  de  Pascal,  permet  de  rechercher  immédiate- 
ment quel  est,  pour  un  nombre  déterminé  d'objets,  le 
nombre  de  combinaisons  possibles  et  quel  est  le  nombre  de 
manières  dont  m  choses  peuvent  être  choisies  en  combinai- 
son de  n  choses  données.  La  solution  de  ce  problème  nous 
permet  en  même  temps  de  résoudre  un  certain  nombre  de 
questions  simples  du  calcul  des  probabilités.  Stanley  Jevons, 
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dans  son  ouvrage  cité  plus  liant,  donne  la  formule  suivante 
pour  la  construction  du  triangle  arithmétique  : 

On  commence,  dit-il,  par  inscrire  l'unité  au  sommet,  puis, 
à  la  ligne  suivante,  nous  plaçons  une  seconde  unité  à  la 
droite  de  la  première.  Pour  obtenir  la  troisième  ligne  de 
chiffres,  nous  reculons  la  ligne  précédente  d'un  rang  à 
droite  et  nous  les  additionnons  aux  mêmes  chiffres,  tels 
qu'ils  étaient  avant  d'être  reculés.  Soit  l'exemple  suivant  : 
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La  règle  est  formulée  d'une  façon  un  peu  différente  par 
M.  Em.  Borel  : 

<(  On  inscrit  sur  une  première  ligne  le  nombre  1  répété 
deux  fois,  puis  on  calcule  chaque  nombre  à  inscrire  dans  les 
lignes  suivantes,  en  ajoutant  au  nombre  inscrit  immédia- 
tement au-dessus  de  lui  le  nombre  inscrit  à  la  gauche  de 
celui  auquel  on  l'ajoute;  dans  l'application  de  cette  règle, 
on  suppose  mentalement  que  les  lignes  sont  prolongées  à 
droite  et  à  gauche  par  des  zéros  (1).  » 

Nous  reproduisons  ici  le  triangle  arithmétique  calculé 
pour  les  17  premières  lignes.  Il  est  évident  que  ce  calcul 
peut,  en  théorie,  être  répété  sans  limite,  mais  on  arrive 
rapidement  à  des  chiffres  tellement  forts  que,  pratiquement, 
la  solution  possible  est  renfermée  dans  des  limites  relati- 
vement étroites. 


(1)  Emit.e  Borf.l,  Eléments  de  la  théorie  des  probabilités  Paris,  Hermann, 
1909,  p.  9. 
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pe 

Colonnes 

■f-. 

i 

2 

3 

4 

5 

6 

7 

3 

9 

10 

11 

12 

1  13 

14 

15 

16 

17 
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i 

1 
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1 
2 

3 

2 

1 

4 

4 

1 

3 

3 

1 

8 

5 

1 

4 

6 

4 

1 

16 

6 

1 

5 

10 

10 

5 

1 

32 

7 

1 

6 

15 

20 

15 

6 

1 

64 

8 

1 

7 

21 

35 

35 

21 

7 

1 

128 

9 

,  1 

8 

28 

56 

70 

56 

28 

8 

1 

256 

10 

1 

9 

36 

84 

126 

126 

84 

36 

9 

1 

S12 

11 

1 

10 

45 

120 

210 

252 

210 

120 

45 

10 

l 

— 

1024 

12 

1 

11 

55 

165 

330 

462 

462 

330 

165 

55 

11 

1 

2048 

13 

1 

12 

66 

220 

495 

792 

924 

792 

495 

220 

66 

12 

1 

4096 

14 

1 

13 

78 

286 

715 

1287 

1716 

1716 

1287 

715 

286 

78 

13 

1 

8192 

15 

1 

14 

91 

364 

1001 

2002 

3003 

3432 

3003 

2002 

1001 

364 

91 

14 

1 

16384 

16 

1 

15 

105 

455 

1365 

3003 

5005 

6435 

6435 

5005 

3003 

1365 

455 

105 

15 

1 

32768 

17 

1 

16 

120 

560 

1820 

4368 

8008 

11440 

12870 

11440 

8008 

4368 

1820 

560 

120 

16 

1 

65536 

44.  Le  triangle  arithmétique  réunit  une  série  de  pro- 
priétés. En  premier  lieu,  nous  remarquons  que  le  total  des 
nombres  inscrits  sur  chaque  ligne  augmente  selon  la  pro- 
gression 2,  4,  8,  16,  32,  64,  etc.,  en  sorte  que  la  somme  de 
chaque  ligne  horizontale  représente  le  double  de  la  ligne 
immédiatement  supérieure  et  la  moitié  de  la  ligne  subsé- 
quente. 

Il  suit  également  du  mode  de  construction  du  tableau  que 
la  différence  des  nombres  dans  chaque  colonne  peut  être 
trouvée  dans  la  colonne  précédente  à  gauche,  un  rang  plus 
haut.  L'unité  qui  apparaît  dans  la  première  colonne  est  la 
première  différence  des  nombres  inscrits  dans  la  seconde 
colonne  et  ainsi  de  suite. 
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La  disposition  des  nombres  est  symétrique,  c'est- 
à-dire  qu'ils  vont  en  augmentant  jusqu'au  milieu,  puis  ils 
diminuent  de  la  même  façon.  Dans-  les  lignes  de  rang  pair, 
le  partage  se  fait  exactement  au  milieu,  en  un  nombre 
unique  ;  dans  les  lignes  de  rang  impair,  ce  partage  égal  ne 
peut  être  réalisé  et  l'on  trouve  le  nombre  le  plus  élevé 
répété  deux  fois.  A  chaque  ligne,  le  point  le  plus  élevé  est 
donc  tantôt  indiqué  une  seule  fois,  tantôt  deux  fois,  et  la 
place  que  ce  nombre  occupe  est  chaque  fois  d'une  rangée 
de  plus-  à  droite. 

Enfin,  le  triangle  arithmétique  permet  de  trouver  immé- 
diatement les  coefficients  des  puissances  successives  d'un 
binôme  :  la  première  colonne  horizontale  renferme  les  coef- 
ficients de  la  première  puissance  du  binôme;  la  deuxième, 
les  coefficients  de  la  deuxième  puissance;  la  nm',  les  coeffi- 
cients de  la  nme  puissance.  Le  triangle  arithmétique  facilite 
ainsi  l'application  du  binôme  de  Newton,  puisque  nous 
savons  d'ailleurs  que  les  exposants  de  la  lettre  a  vont  sans 
cesse  en  diminuant  et  que  ceux  de  la  lettre  b  vont  en 
augmentant. 

Le  triangle  arithmétique  présente  le  grand  avantage  de 
résoudre  immédiatement  les  problèmes  de  combinaison,  en 
indiquant  de  combien  de  manières  on  peut  choisir  m  choses 
en  combinaison  de  n  choses.  Voici  un  exemple  emprunté  à 
Stanley  Jevons  :  on  demande  de  combien  de  manières  une 
sous-commission  de  5  membres  pourra  être  choisie  parmi 
un  comité  qui  compte  9  membres. 

Le  calcul  donne  : 

9  g  9.8.7.6.5 

y'  5  ~  1.2.3.4.5    ~  12b' 

mais  nous  pouvons  supprimer  tout  calcul,  en  nous  servant 
du  triangle  arithmétique;  il  suffit  de  nous  reporter  à  la 
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dixième  ligne  et  de  consulter  le  chiffre  inscrit  à  la  sixième 
colonne,  où  nous  trouvons  126  (1). 

Parmi  10  invités,  on  désire  faire  des  classements  3  par  3. 
Combien  y  a-t-il  de  classements  possibles?  Nous  consultons 
la  onzième  ligne,  quatrième  colonne,  et  nous  lisons  la  ré- 
ponse 120.  En  effet,  le  calcul  donne  : 

C  10,  3  -  ^  'l'I   =  120. 

Nous  empruntons  encore  à  M.  Borel  le  problème  suivant 
dont  la  solution  est  donnée  immédiatement  par  la  simple 
lecture  du  triangle  arithmétique  : 

((  Y  a-t-il  plus  d'avantage  à  parier  que  l'on  gagnera  au 
jeu  de  pile  ou  face,  au  moins  5  parties  sur  7  ou  que  l'on 
en  gagnera  au  moins  6  sur  9  ?  » 

Nous  reportant  au  triangle  arithmétique  construit 
d'après  la  méthode  de  Stanley  Jevons,  nous  avons  à  con- 
sulter, pour  déterminer  la  valeur  du  premier  cas  5/7,  la 
huitième  ligne,  sixième  colonne  et,  bien  entendu,  à  addi- 
tionner les  nombres  consécutifs  dont  la  somme  formera 
le  total  des  cas  favorables.  Nous  lisons  les  nombres  sui- 
vants- : 

29 

21  4-  7  a-  1  =  

-r-  i  -r  i  ,j2g* 

En  procédant  de  même  pour  la  seconde  hypothèse,  nous 
avons  à  la  dixième  ligne,  septième  colonne  : 

8i  +  36  +  l=^- 

I  3 

La  première  fraction  représente  :  -j-  -  jgg;  la  seconde 
vaut  —  +     ;  la  seconde  hypothèse  est  donc  légèrement  plus 
favorable  que  la  première. 


(1)  Ceci  d'après  la  règle  de  formation  du  triangle  donnée  par  Stanley 
Jevons.  Si  l'on  adopte  la  règle  indiquée  par  Borel.  il  faut  consulter  la 
neuvième  ligne. 
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45.  La  formule  mathématique  des  probabilités  est  la  même 
que  celle  des  combinaisons,  d'où  il  suit  que  le  triangle  arith- 
métique est  également  capable  de  fournir  la  réponse  à 
donner  aux  questions  simples  du  calcul  des  probabilités, 
comme  nous  venons  de  le  voir  par  l'exemple  des  paris 
engagés  su,r  la  chance  respective  de  gagner  5  parties  sur  7 
ou  6  parties  sur  9. 

La  notion  la  plus  simple  de  la  probabilité  mathématique 
s'exprime  en  disant  que  cette  probabilité  est  mesurée  par  le 
rapport  entre  le  nombre  de  cas  favorables  et  le  nombre  de 
cas  possibles.  Les  cas  possibles  sont  mesurés  par  le  nombre 
de  combinaisons  possibles  ;  les  cas  favorables  sont  ceux  dont 
nous  attendons  l'arrivée.  La  probabilité  la  plus  grande  est 
exprimée  par  le  rapport  le  plus  élevé  existant  entre  les-  deux 
nombres  de  cas  possibles  et  de  cas  favorables.  En  dehors 
de  ce  point,  la  probabilité  décroît  graduellement. 

La  théorie  des  probabilités  dans  ses  rapports  avec  la  sta- 
tistique sera  examinée  en  détail  à  l'endroit  où  l'on  parlera 
de  la  loi  de  la  répartition  des  erreurs  accidentelles.  Pour 
le  moment,  il  suffit  de  rappeler  que  les  phénomènes  collec- 
tifs comportent  une  série  de  manifestations  indépendantes 
parmi  lesquelles  nous  avons  à  rechercher  quelle  est  la  plus 
probable.  Or,  pour  exprimer  la  probabilité  de  plusieurs 
événements  qui  sont  indépendants  entre  eux,  il  faut  consi- 
dérer deux  hypothèses  :  s'il  y  a  deux  événements  ou  plus 
qui  ne  peuvent  arriver  en  même  temps,  la  probabilité  que 
l'un  ou  l'autre  arrivera  est  la  somme  de  leurs  probabilités 
respectives;  s'il  y  a  deux  événements  dépendant  l'un  de 
l'autre  de  telle  sorte  que  le  premier  doive  avoir  lieu  avant 
que  le  second  puisse  se  produire,  la  probabilité  de  l'arrivée 
simultanée  des  deux  événements  est  le  produit  de  la  proba- 
bilité du  premier  par  la  probabilité  qu'après  l'arrivée  du 
premier  le  second  surviendra.  La  probabilité  composée 
d'événements  indépendants,  observée  par  des  épreuves  ou 
observations  successives,  présente  un  développement  cor- 
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respondant,  clans  sa  forme  mathématique,  à  celui  d'un  bi- 
nôme élevé  à  une  puissance  égale  au  nombre  des  épreuves 
ou  observations.  On  connaît  la  forme  du  binôme  qui,  expri- 
mée graphiquement,  correspond  à  la  courbe  binomiale  si 
souvent  utilisée  par  Quetelet  et  les  autres  statisticiens  (1). 

Le  fait  que  l'on  connaît  la  marche  suivie  par  les  pro- 
babilités dans  leur  ordre  de  succession  permet  de  re- 
chercher les  combinaisons  les  plus  probables  parmi  les 
événements  composés;  la  probabilité  des  différentes  combi- 
naisons des  éléments  de  la  série  correspond  donc  aux  termes 
de  ce  développement  et  le  terme  qui  a  la  valeur  la  plus  élevée 
indiquera  la  combinaison  qui  se  présente  comme  la  plus 
favorable  (2). 

Théoriquement,  les  phénomènes  collectifs  se  présente- 
raient comme  des  probabilités  composées  et  l'on  pourrait 
déterminer  le  nombre  de  leurs  combinaisons  possibles 
et  l'ordre  probable  de  leur  arrivée. 

46.  Si  nombreuses  sont  les  régularités  d'ordre  statistique 
constatées  à  propos  des  phénomènes  démographiques  et 
moraux,  que  leur  multiplicité  même  est  un  argument 
contre  le  caractère  de  «  loi  ))  que  de  nombreux  statis- 
ticiens ont  voulu  leur  attribuer.  Les  lois  scientifiques  sont 
d'une  rare  et  pure  essence  et  on  ne  conçoit  pas  qu'à  l'aide 
de  quelques  chiffres  on  puisse  en  déterminer  pour  ainsi  dire 
à  volonté,  pas  plus  à  propos  des  faits  économiques  et  sociaux 
qu'à  propos  des  phénomènes  physiques,  astronomiques  ou 


(1)  Si  l'on  donne  à  m,  'dans  la  formule  binominale  (a+b)  m,  la  valeur 
successive  de  2,  3,  4,  5,  (i,  on  a  : 

(a  4-  6)-  =  »«  -f  2  ab  +  6*. 

[a  +  6)3  =  a3  -f  3  «26  -f  3  a62  -f-  6', 

(a  +  6)<  =  a»  +  4  a:i6  +  6  a262  -f-  4  «63  -f  6'. 

(a  +  6)r>  =  a*  +  5  a46  _|_  !Q  a*&»  -f-  10  a?63  +  5  «64  -f  6\ 

(«  -f  6)6  =  «6  _{.  6  a56  -f  15  a*bi  -f  20  «363  +  15  «26<  -f  6  «6S  +  66. 

(2)  Bosco,  loc.  cit.,  p.  117.  Pour  la  loi  des  coefficients  et  la  loi  des 
exposants,  voir  les  explications  données  supra,  n°  35. 
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biologiques.  Les  Newton  sont  rares.  Il  n'appartient  pas  à  la 
statistique  de  revendiquer  pour  elle  une  fécondité  aussi 
prodigieuse  dans  la  découverte  des  «  lois  ».  Ce  que  la  sta- 
tistique constate  donc,  ce  sont  bien  des  <(  régularités  »,  des 
tendances  générales  résultant  de  causes  multiples,  les  unes 
générales,  les  autres  accidentelles,  tendances  qui  perdurent 
et  dont  les  manifestations  se  reproduisent,  mais  sans  rien 
d'absolu  et  de  définitif. 

La  question  se  pose  tout  naturellement  de  savoir  si  l 'ap- 
plication du  calcul  des  probabilités  aux  faits  relevés  par  la 
statistique  est  possible,  légitime  et  utile.  Nous  savons  que 
certains  phénomènes  se  sont  produits  dans  telles-  conditions 
et  en  tel  nombre;  nous  prévoyons  aussi  qu'ils  se  repro- 
duiront ;  peut-on,  à  l'aide  du  calcul,  déterminer  la  mesure  de 
leur  arrivée  éventuelle?  Le  calcul  des  probabilités  appliqué 
aux  phénomènes  statistiques  présente  une  réelle  utilité, 
ainsi  que  nous  le  montrons  plus  loin  par  quelques  exemples. 
Il  faut  distinguer  deux  espèces  de  probabilités  :  la  probabi- 
lité a  priori  et  la  probabilité  a  posteriori.  La  seconde  est  le 
résultat  de  l'expérience  ;  après  avoir  observé  et  dénombré  un 
grand  nombre  de  faits,  après  avoir  constaté  qu'ils-  se  repré- 
sentent d'une  façon  régulière,  on  conclut  à  la  répétition  du 
phénomène  dans  les  mêmes  conditions.  Mais  la  probabilité, 
au  sens  rigoureux  du  mot,  est  donnée  par  la  probabilité 
a  priori  qui  résulte  du  calcul.  On  peut  la  définir  —  en  se 
bornant  à  la  notion  de  la  probabilité  simple  —  «  le  rapport 
entre  le  nombre  de  cas  favorables  à  l'attente  d'un  événe- 
ment et  le  nombre  de  cas  possibles  à  la  condition  que  tous 
les  cas,  favorables  ou  non,  soient  ou  puissent  raisonnable- 
ment être  supposés-  possibles  au  même  degré  (1)  ». 

La  portée  générale  du  calcul  des  probabilités  a  été  ainsi 
résumée  par  M.  Poincaré  :  «  La  méthode  des  sciences  phy- 
siques, écrivait  cet  éminent  mathématicien,  repose  sur  l'in- 


(1)  Benini,  Statistica  méiodologica,  p.  213 


CARACTÈRES  PROPRES  A  LA  STATISTIQUE 


69 


duction  qui  nous  fait  attendre  la  répétition  d'un  phéno- 
mène quand  se  reproduisent  les-  circonstances  où  il  avait 
une  première  fois  pris  naissance.  Si  toutes  ces  circonstances 
pouvaient  se  reproduire  à  la  fois,  ce  principe  pourrait  être 
appliqué  sans  crainte;  mais  cela  n'arrivera  jamais,  quel- 
ques-unes de  ces  circonstances  feront  toujours  défaut. 
Sommes-nous  absolument  sûrs  qu'elles  sont  sans  impor- 
tance? Cela  pourra  être  vraisemblable;  cela  ne  pourra  pas 
être  rigoureusement  certain.  De  là,  le  rôle  considérable  que 
joue  dans  les  sciences  physiques  la  notion  de  probabi- 
lité (1).  » 

Il  n'y  a  pas  de  doute  que  de  nombreux  phénomènes  collec- 
tifs se  comportent  dans  leurs  combinaison  et  distribution 
comme  l'indique  le  calcul  des  probabilités.  Mais  la  ressem- 
blance entre  les  données  résultant  du  calcul  et  les  données 
provenant  de  l'expérience  n'est  pas  parfaite.  «  Il  ne  faut 
pas  perdre  de  vue,  écrit  M.  Borel,  qu'il  y  a  la  même  diffé- 
rence entre  ces  probabilités  statistiques  et  les  probabilités 
abstraitement  et  rigoureusement  définies  qu'entre  les  fi- 
gures étudiées  en  géométrie  et  les  représentations  plus  ou 
moins  grossières  qu'on  rencontre  dans  la  nature  ;  entre  une 
sphère,  par  exemple,  et  une  orange  (2).  » 

47.  L'application  du  calcul  des  probabilités  aux  données 
de  la  statistique  présente  cet  avantage  d'établir  précisément 
quelle  est  la  différence  entre  l'orange  et  la  sphère  tracée 
par  le  géomètre;  en  comparant  les  résultats  de  l'expé- 
rience avec  ceux  du  calcul  on  aura  la  mesure  et  la  direc- 
tion des  déviations  provoquées  par  un  complexus  de  causes 
agissant  sur  le  phénomène  naturel  dans  les  conditions  où 
il  se  produit. 


(1)  H.  Poincaré,  La  Science  et  l'Hypothèse.  Paris,  Flammarion,  «  Introduc- 
tion »,  p.  6. 

(2)  Emile  Borel,  Eléments  de  la  théorie  des  probabilités.  Paris,  Hermann, 
p.  158. 
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La  différence  observée  entre  le  résultat  théorique  de  la 
probabilité  mathématique  et  le  résultat  pratique  constaté 
par  le  relevé  statistique  est  plus  ou  moins  grande,  selon 
qu'il  s'agit  de  faits  de  la  nature  ou  de  faits  influencés 
par  la  volonté  libre  de  l'homme.  Les  faits  de  la  nature  sont 
doués  d'une  plus  grande  fixité  et  s'écartent  moins  du  calcul  ; 
on  les  rencontre  surtout  en  démographie  ;  les  faits  influen- 
cés par  la  volonté  de  l'homme  se  trouvent  surtout  dans  le 
domaine  de  la  statistique  morale,  mais  il  en  est  également 
en  démographie,  par  exemple  les  combinaisons  matrimo- 
niales étudiées  sous  le  rapport  de  l'état  civil  des  époux  ou 
au  point  de  vue  de  leur  instruction.  Quand  on  parle  du 
caractère  de  fixité  que  présentent  les  faits  de  la  nature,  on 
se  place  à  un  point  de  vue  relatif,  car  les  phénomènes  les 
plus  constants  dans  leurs  manifestations-  quantitatives  pré- 
sentent à  la  longue  d'assez  curieuses  modifications.  Ainsi 
en  est-il  du  rapport  bien  connu  entre  le  nombre  de  nais- 
sances masculines  et  celui  des  naissances  féminines,  comme 
le  montre  l'exemple  suivant  : 

Proportion  des  naissances  masculines  pour  cent  naissances  féminines. 


Années 

Belgique 

Années 

Italie  (1) 

1841  à  1850  . 

.  105.48 

1851  à  1860  . 

.  105.44 

18(51  à  1870  . 

.  105.39 

1871  à  1880  .  . 

.  104.88 

1872  à  1875  .  . 

.  106,48 

1876  à  1880  .  • 

.  106,34 

1881  à  1890  •  • 

.  104,63 

1881  à  1885  .  • 

.  106,06 

1886  à  1890  .  . 

.  105,85 

1891  à  1900  .  . 

.  104,84 

1891  à  1895  .  . 

.  105,73 

1896  à  1902  .  . 

.    105  67 

1901  à  1910  .  . 

.  104,61 

Les  chiffres  relatifs  à  la  Belgique  sont  ceux  des  nais- 
sances masculines  légitimes,  tandis  que  les  données  se  rap- 
portant à  l'Italie  visent  les  enfants  nés  vivants,  d'une  façon 


(1)  Les  chiffres  pour  l'Italie  sont  reproduits  d'après  Benini,  Mtatistica 
metodologica,  p.  226,  note  1.  Les  chiffres  pour  la  Belgique  viennent  de  l'An- 
nuaire statistique  de  la  Belgique. 
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générale.  Ce  fait  ne  change  rien  à  la  curieuse  constatation 
d'une  diminution  constante  (sauf  une  fois,  en  Belgique, 
entre  1891  et  1900)  du  rapport  des  naissances  masculines. 
On  voit  donc  que  les  phénomènes  réputés  les  plus  fixes 
sont  susceptibles  de  subir  des  modifications  lentes  qui 
semblent  les  faire  insensiblement  dévier  de  la  notion  admise 
comme  exacte.  Le  calcul  des  probabilités  intervient  ici 
encore  pour  préciser  la  valeur  de  ces  déviations  et  faire 
reconnaître  si  leur  ampleur  est  suffisante  pour  devoir  faire 
rejeter  l'hypothèse  d'une  probabilité  constante  exprimant 
un  complexus  de  causes  essentielles,  dominant  nettement  les 
causes  accidentelles.  On  a  construit  des  tables  qui  servent 
à  déterminer  la  probabilité  que  le  phénomène  reste  contenu 
dans  les  limites  de  l'écart  probable,  c'est-à-dire  un  certain 
degré  de  déviation  qui  présente  une  égale  probabilité  d'être 
ou  de  n'être  pas  surpassée  en  un  nombre  donné  d'épreuves 
et  dont  l 'expression  mathématique  est  : 

±  0,4769  sTY^fq 

m  étant  le  nombre  des  épreuves,  p  et  q  les  probabilités 
simples  des  événements  attendus,  et  0,4769  représentant 
précisément  le  point  médian  des  valeurs  calculées  allant  de 
1  p.  c.  à  99  p.  c. 

Le  résultat  du  calcul  étant  connu,  si  l'on  trouve  que  cet 
écart  est  constamment  dépassé  par  rapport  à  la  probabilité 
typique,  on  pourra  légitimement  soupçonner  la  présence 
d'une  cause  perturbatrice.  Bien  entendu,  ceci  suppose  que 
l'on  ait  fait  disparaître  au  préalable,  au  moyen  de  l'inter- 
polation, les  variations  dépendant  d'une  cause  générale. 

En  appliquant  donc  le  calcul  des  probabilités  à  des  séries 
suffisamment  étendues,  on  arrivera  à  mettre  en  lumière  leur 
caractère  de  stabilité  ou  d'instabilité,  ce  qui  est  encore  un 
résultat  essentiel  dans  les  recherches  statistiques  (1). 


(  1  )  Benini,  Statistica  metodologica,  pp .  223  et  225 . 
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48.  Dans  le  domaine  des  faits  influencés  par  la  libre  vo- 
lonté de  l'homme,  le  calculdes  probabilités  intervient  utile- 
ment pour  montrer  jusqu'à  quel  point  les  résultats  de 
l'expérience  s'écartent  de  ceux  du  calcul  théorique,  c'est-à- 
dire  pour  déterminer  la  loi  empirique  du  phénomène  et 
permettre  de  comparer  les  tendances  constatées  avec  les 
données  absolues  résultant  du  calcul.  Dans  le  calcul  des  pro- 
babilités, on  doit  supposer  que  tous  les  événements,  favo- 
rables ou  défavorables,  sont  également  possibles,  c'est-à- 
dire  qu'on  les  assimile  au  tirage  de  boules  de  différentes 
couleurs  d'une  urne  qui  contiendrait  en  nombre  égal  des 
boules  blanches  et  des  boules  noires.  Mais  il  existe  des  ten- 
dances qui,  en  pratique,  manif estent  leurs  effets  dans  l'asso- 
ciation ou  la  séparation  de  certains  caractères,  de  telle 
sorte  que  la  comparaison  des  deux  résultats  montre  à  quelle 
loi  empirique  obéit  le  phénomène  considéré.  Benini  donne 
l'exemple  suivant,  tiré  de  la  statistique  italienne,  concernant 
les  combinaisons  matrimoniales  entre  illettrés  et  illettrées. 
Nous  résumons  ses  constatations  présentées  dans  une  forme 
aussi  claire  que  sobre  : 

En  1896,  les  époux  et  les  épouses  capables  de  signer  leur 
acte  de  mariage  furent  en  Italie  dans  la  proportion  respec- 
tive de  63,04  et  de  47,44  p.  c,  ce  qui  laissait  pour  les 
hommes  une  proportion  de  36,96  p.  c.  d'illettrés  et  pour 
les  femmes  une  proportion  de  52,66  p.  cf.  Si  on  veut  savoir 
quelle  est  la  chance  qu'un  homme  sachant  signer  son  nom 
épouse  une  femme  ne  le  sachant  pas,  ou  réciproquement,  ou 
que  des  illettrés  se  marient  entre  eux,  ou  que  les  combi- 
naisons matrimoniales  se  forment  entre  personnes  sachant 
l'une  et  l'autre  écrire,  on  n'a  qu'à  calculer  les  résultats  en 
appliquant  le  théorème  de  la  probabilité  composée,  c'est-à- 
dire  à  multiplier  entre  elles  les  probabilités  simples.  Lors- 
qu'on compare  les  résultats  du  calcul  théorique  aux  données 
de  fait  relevées  par  l'observation  statistique,  on  constate 
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une  forte  différence,  ainsi  que  le  montre  le  petit  tableau 
suivant  : 


COUPLES 

Probabilité 
mathématique. 

Observation 
statistique 

Différences. 

Groupes  ('curé  et  lettrée  . 

29,91  p.  c. 

42,44  p.  c. 

+  12,b3  p.  c. 

semblables  jilleUréet  iJ|eUré(> 

19,42  p.  c. 

31,96  p.  c. 

+  12,54  p.  c. 

Groupes  j  lettré  et  illettrée  . 

33,13  p.  c. 

20,60  p.  c. 

—  12.53  p.  c. 

Afférents  jUIettpé  et  ,eUl.ée 

17,54  p.  c. 

5,00  p.  c. 

—  12,54  p.  C. 

La  probabilité  mathématique  est  établie  comme  si  les 
conditions  sociales,  qui  sont  plus  ou  moins  exactement 
exprimées  par  ce  degré  élémentaire  d'instruction  permet- 
tant à  l'intéressé  de  signer  son  acte  de  mariage,  étaient  des 
éléments  indifférents.  Mais  il  est  démontré  en  démographie 
que  les  époux  cherchent  en  général  à  s'associer  dans  des  con- 
ditions semblables  sous  le  rapport  de  l'instruction,  de  l'âge, 
de  l'état  civil,  etc.  Le  tableau  ci-dessus  nous  montre  que 
l'attraction  exercée  par  des  conditions  égales  au  point  de 
vue  de  l'instruction  s'exprime  par  une  différence  de 
12  1/2  p.  c.  au-dessus  ou  au-dessous  du  calcul  théorique. 

Les  exemples  qui  précèdent  suffisent  à  préciser  le  genre 
de  services  que  le  calcul  des  probabilités  peut  rendre  à  la 
statistique  en  lui  fournissant  un  point  de  comparaison  fixe 
qui  permet  de  dégager  la  loi  empirique  des  phénomènes. 
Ce  point  apparaît  comme  d'une  importance  capitale  dans 
l'interprétation.  Il  suffit  de  l'avoir  souligné  dans  ces  obser- 
vations préliminaires  qui  ne  doivent  pas  empiéter  sur  les 
développements  ultérieurs  de  cet  ouvrage. 

49.  Précisons  simplement  quelles  sont  les  différences- 
qui  se  marquent  entre  la  probabilité  a  priori  et  la  proba- 
bilité a  posteriori,  ou,  comme  dit  M.  Emile  Borel,  les  dif- 
férences entre  la  sphère  et  l 'orange. 
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1°  Dans  la  probabilité  mathématique,  on  considère  que 
les  éléments  qui  entrent  en  ligne  de  compte  sont  parfaite- 
ment indépendants  entre  eux  et  qu'ils  peuvent  se  combiner 
ensemble  de  toutes  les  façons  possibles,  de  telle  façon  que 
le  calcul  du  nombre  de  cas  possibles  s'opère  d'après  les 
règles  indiquées  plus  haut. 

Au  contraire,  la  probabilité  statistique  ou  a  posteriori  ne 
comporte  pas  le  libre  jeu  de  tous  les  éléments  qui  y  inter- 
viennent. La  présence  de  l'un  peut  amener  la  disparition 
de  l'autre  et  provoquer  l'arrivée  d'un  troisième. 

C'est  donc  l'expérience  qui  doit  nous  éclairer  en  nous 
permettant  de  comparer  les  résultats  de  l'observation  avec 
ceux  du  calcul  théorique. 

2°  La  base  de  la  probabilité  a  posteriori  se  trouve  dans 
un  nombre  suffisant  d'observations  réalisées  selon  les 
règles  de  la  technique  statistique.  Mais  quand  un  nombre 
d'observations  est-il  suffisant  en  soi,  ou  quand  pouvons- 
nous  le  considérer  comme  offrant  une  base  suffisante  ?  On 
a,  par  exemple,  l'habitude  de  diviser  des  phénomènes  con- 
tinus, comme  ceux  de  l'ordre  démographique,  d'après  des 
divisions  du  temps,  correspondant  à  la  vie  civile,  on 
compte  les  naissances,  les  mariages,  les  décès,  par 
année.  Qui  no  as  dit  qu'une  année  offre  un  terrain  suf- 
fisant à  l'observation  pour  baser  sur  les  constatations 
effectuées  durant  ce  temps  une  probabilité  a  posteriori! 
Cette  division  du  temps  que  nous  appelons  une  année  a  une 
importance  réelle  en  astronomie  et,  pour  mesurer  les  faits 
de  la  vie  civile,  elle  est  une  unité  logiquement  choisie.  Com- 
ment pouvons-nous  savoir  qu'elle  convient  également  pour 
observer  les  faits  sociaux  dont  nous  avons  à  apprécier  la 
probabilité  de  répétition?  Remarquons,  en  passant,  que  la 
mesure  du  temps  d'observation  ne  devrait  pas  être  la 
même  pour  tous  les  faits  :  il  y  a  un  grand  nombre  de  nais- 
sances et  de  décès  chaque  jour,  donc  au  bout  d'une  année 
il  y  en  a  un  nombre  respectable,  mais  il  y  a  moins  de  ma- 
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riages,  moins  encore  de  divorces.  Pourtant,  pour  les  uns 
comme  pour  les  autres,  on  note  ceux  qui  se  sont  présentés 
en  une  année. 

3°  La  probabilité  mathématique  s'applique  d'ordinaire  à 
des  faits  simples;  pour  la  probabilité  statistique,  les  phé- 
nomènes complexes  collectifs  interviennent  fréquemment. 
La  possibilité  d'une  naissance  masculine  ou  féminine  est 
une  probabilité  simple,  appuyée  sur  des  observations  extrê- 
mement nombreuses,  basées  sur  une  loi  générale;  on  peut 
espérer  atteindre  un  degré  de  probabilité  assez  élevé  à 
l'aide  des  éléments  dont  on  dispose,  pourvu  qu'on  n'attende 
pas  la  réalisation  de  cette  probabilité  dans  un  cas  parti- 
culier, mais  simplement  comme  caractéristique  d'un  grand 
nombre  de  cas  envisagés  ensemble.  Il  y  a  aussi  des  phéno- 
mènes complexes  donnant  lieu  à  des  probabilités  composées  : 
le  mariage  d'un  veuf  avec  une  veuve,  d'un  célibataire  avec 
une  jeune  fille,  d'une  jeune  fille  avec  un  veuf,  d'une  veuve 
avec  un  célibataire,  sont  des  événements  donnant  lieu  à 
des  probabilités  composées  dont  la  réalisation  est  moins 
certaine,  comme  on  l'a  vu  plus  haut,  que  celle  envisagée 
dans  l'exemple  précédent.  La  probabilité  théorique,  qui  se 
déduit  du  calcul,  est  fréquemment  en  discordance  avec  les 
résultats  de  l'observation  dans  les  phénomènes  complexes, 
elle  s'en  rapproche  davantage  dans  les  phénomènes  simples. 
Le  degré  de  sécurité  dans  la  prévision  n'est  donc  pas  le 
même  pour  tous  les  cas  fondés  sur  la  probabilité  a  poste- 
riori. 

4"  Une  dernière  différence  sépare  la  probabilité  mathé- 
matique de  la  probabilité  statistique  :  elle  consiste  dans  la 
permanence  des  caractères  qui  sont  la  base  de  la  première 
et  dans  les  modifications  constantes  qui  se  remarquent  dans 
les  éléments  constitutifs  de  la  seconde.  Lorsque  je  calcule 
combien  de  fois  apparaîtra  telle  face  des  dés  dans  un 
nombre  donné  de  parties,  je  suppose  d'abord  que  toutes  les 
faces  de  ces  dés  peuvent  apparaître  indifféremment  et  que 
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le  jeu  ne  modifiera  pas  leur  construction.  Mais  cette  suppo- 
sition, je  ne  puis  la  faire  à  propos  des  phénomènes  sociaux 
relevés  par  la  statistique,  ou  plutôt  l'on  peut  faire  la  sup- 
position opposée.  Les  faits  démographiques,  sociaux,  éco- 
nomiques, se  modifient  constamment  et  les  prévisions 
qui  se  basent  sur  l'observation  ne  peuvent  être  qu'à  brève 
échéance.  Si  nous  n'apercevons  pas  immédiatement  les 
changements  qui  se  sont  produits,  la  raison  en  est  à  l'imper- 
fection des  moyens-  mis  en  œuvre  pour  observer  et  recueillir 
les  faits.  Avec  la  probabilité  mathématique,  nous  sommes 
dans  l'absolu;  au  contraire,  la  probabilité  a  posteriori  est 
toute  relative  et  n'autorise  qu'une  prévision  qui  devance 
timidement  les  faits;  aussi  l'observation  statistique  qui  lui 
sert  de  base  n'a-t-elle  qu'une  valeur  limitée  dans  le  temps 
et  doit-elle  être  renouvelée  à  des  intervalles  assez  proches. 


III.  —  La  statistique  et  les  mathématiques. 

50.  C'est  un  sujet  de  vives  controverses  entre  statisticiens 
théoriciens  et  professionnels  que  la  question  de  savoir 
quelles  sont  au  juste  les  relations  entre  la  statistique  et  les 
mathématiques  et  ce  qu'elles  devraient  être.  Si  opposées 
sont  les  'vues,  si  tranchées  sont  les  positions  qu'il  faut 
renoncer,  lorsqu'on  expose  des  idées  de  juste  milieu,  à  se 
concilier  les  deux  adversaires.  Les  professionnels  trouve- 
ront sans  doute  qu'on  aura  trop  cédé  à  un  entraînement 
vers  l'aspect  scientifique  pur,  les  théoriciens  seront  d'avis 
que  la  thèse  soutenue  est  incomplète  et  regretteront  de 
n'avoir  pas  été  toujours  suivis  dans  leurs  revendications. 
Si  ingrate  que  soit  cette  position  de  l'homme  exposé  aux 
feux  croisés  de  ses  adversaires,  c'est  pourtant  celle  que 
nous  prendrons. 

Certains  mathématiciens  sont  catégoriques  dans  l'expres- 
sion de  leur  opinion  qui,  parfois,  prend  les  allures  d'un 
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arrêt  :  «  Les  sciences  statistiques,  disait  Fourier  au  début 
du  xix"  siècle,  ne  feront  de  véritables  progrès  que  lors- 
qu'elles seront  confiées  à  ceux  qui  ont  approfondi  les  théo- 
ries mathématiques  (1).  » 

Racioppi  a  soutenu  que  ce  sont  les  mathématiques  seules 
qui  ont  élevé  la  statistique  au  rang  de  science  (2).  Un  ma- 
thématicien français,  M.  H.  Laurent,  soutient  la  même  thèse 
avec  beaucoup  d'animation;  selon  lui,  «  une  erreur  très 
répandue  consiste  à  croire  que  celui  qui  dirige  des  opéra- 
tions de  statistique  n'a  pas  besoin  de  connaître  les  mathé- 
matiques, le  calcul  des  probabilités  et  en  général  les  sciences 
auxquelles  correspondent  les  chiffres  qu'il  interprète  (3)  ». 
Aussi,  comme  cette  erreur  est  surtout  celle  des  gouvernants-, 
«  nous  ne  possédons  pas  de  bonnes  statistiques  officielles 
parce  que  les  personnes  qui  dirigent  ces  statistiques  ne 
sont  pas  bien  préparées  à  ce  genre  de  travail  (4)  ».  Où  pour- 
rait-on recruter  des  personnes  bien  préparées?  Parmi  les 
membres  de  l'Institut  des  actuaires  français,  répond 
M.  Laurent.  «  C'est  dans  le  sein  de  cette  société  que  le 
gouvernement  trouverait  des  sujets  aptes  à  diriger  des  sta- 
tistiques officielles  (5).  »  Voilà  qui  est  bien  catégorique. 
Les  statisticiens  qui  étaient  en  même  temps  mathématiciens 
ont  montré  plus  de  discrétion.  Messedaglia  se  borne  à  sou- 
haiter que  parmi  les  statisticiens  il  ne  s'en  trouve  plus 
un  seul  qui  soit  ignorant  en  mathématiques  (1).  Ferraris 
est  plus  réservé  encore  :  «  La  statistique  réclame,  dit-il,  de 


(1)  Correspondance  mathématique,  t.  II,  p.  177.  Bruxelles,  1826. 

(2)  Racioppi,  Del  principio  e  dei  limiti  délia  statistica,  p.  108.  Napoli,  1857. 

(3)  H.  Laukenï,  Statistique  mathématique.  Avertissement,  p.  II.  Paris. 
1910. 

(4)  Id.,  loc.  cit.,  p.  II. 

(5)  Id.,  loc.  cit.,  p.  IV. 

(6)  Messedaglia,  Esposizione  critica  délie  stati-stiche  criminali  dell'Im- 
perio  Austriaco,  p.  151. 
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qui  veut  la  posséder  à  fond,  une  certaine  connaissance 
(una  discreta  cuit  tu  a)  des  sciences  mathématiques  (1).  » 

51.  Il  est  intéressant  d'entendre  une  autre  opinion  expo- 
sée par  des  hommes  éminents,  ayant  occupé  les  plus  hautes 
fonctions  dans  la  statistique  administrative  et  ayant  à  leur 
actif  une  longue  série  d 'œuvres  statistiques,  dont  quelques- 
unes  d'allure  monumentale.Voici  l'avis  de  M.Bodio, exprimé 
dans  une  circonstance  solennelle ,  le  discours  de  clôture  de 
la  vingt-troisième  session  de  l'Institut  international  de  sta- 
tistique :  ((  Les  questions  de  méthode,  dit  le  vénéré  prési- 
dent de  l 'Institut,  ont  amené  un  échange  de  vues  entre  les 
statisticiens  au  sujet  de  l'emploi  des  mathématiques  supé- 
rieures. Certes,  les  mathématiques  sont  un  moyen  puissant 
d'analyse  pour  affiner  le  matériel  de  la  statistique  et  un 
instrument  de  synthèse  pour  en  condenser  les  résultats  et 
en  tirer  de  nouvelles  inductions.  Le  danger  est  que  les  ma- 
thématiciens de  profession,  pour  l'amour  de  l'art,  sont 
amenés  parfois  à  trop  subtiliser  et  à  déduire  des  consé- 
quences dépassant,  peut-être,  ce  que  la  qualité  des  obser- 
vations pourrait  permettre;  ils  appliquent  à  ces  observa- 
tions le  trébuchet  du  peseur  d'or,  alors  que  ce  qui  leur 
convient,  c'est  la  balance  grossière  du  marchand.  » 

«  Ce  qui  facilite  la  solution  des  difficultés,  c'est  que,  pour 
certaines  branches,  notamment  pour  la  biométrie,  il  s'est 
formé  presque  une  profession  spéciale,  celle  des  actuaires. 
Pour  les  enquêtes  d'ordre  économique,  le  calcul  supérieur 
n'est  pas  précisément  nécessaire;  on  demande  surtout  un 
jugement  sûr,  un  esprit  critique  et  une  impartialité  absolue, 
dégagée  de  toute  préoccupation  d'école  (2).  » 


(1)  Feukakis.  Lu  statistica  et  la  scienza  dell'  A  mmbmtrazione  nella  favolta 
giuridiche. 

(2)  Bulletin  de  l'Institut  international  de  statistique,  XIIIe  session,  T.  XIX. 
première  livraison,  p.  154. 
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La  thèse  soutenue  par  M.  von  Mayr  dans  son  grand 
traité  (1)  ne  diffère  pas  sensiblement  de  celle-là.  Comme 
M.  Bodio,  il  reconnaît  aux  procédés  mathématiques  l'avan- 
tage d'une  plus  grande  élégance,  mais  loin  d'admettre  qué 
l'emploi  d'une  technique  supérieure  soit  indispensable,  il 
déclare  que  «  tous  les  groupements  des  éléments  statistiques 
et  tous  les  calculs  qui  s'y  rapportent  peuvent  s'exprimer 
dans  le  langage  usuel  de  l'arithmétique  ».  M.  von  Mayr 
ajoute,  pour  fortifier  sa  thèse,  que  le  calcul  des  probabilités 
n'est  admissible,  en  statistique,  qu'à  l'égard  des  phéno- 
mènes de  la  vie  sociale,  qui  présentent  une  certaine  analogie 
avec  la  répétition  de  l'observation  d'un  même  objet  ou  la 
chance  de  retirer  une  certaine  bille  d'une  quantité  limitée 
et  constante  de  billes  de  différentes  couleurs  (2). 

a  Parmi  les  phénomènes  sociaux  les  plus  importants,  dit-il 
encore,  il  en  est  pour  lesquels  c'est  le  changement  perpé- 
tuel des  masses  qui  est  caractéristique;  ici,  certainement, 
le  calcul  des  probabilités  n'a  pas  à  intervenir  ».  Et  comme 
conclusion,  on  peut  retenir  ces  lignes  empruntées  au  même 
auteur  :  «  Une  méthode  d'étude  qui  n'est  accessible  qu'à 
un  cercle  restreint  d'initiés  et  qui,  de  plus,  n'est  pas  abso- 
lument indispensable,  ne  peut  constituer  une  branche  inté- 
grante de  la  statistique,  considérée  comme  une  science  des- 


(1)  G.  von  May it,  Statistik  und  Gcsellschaftshhre,  Fribourg,  1895,  p.  (31ô. 
Cf.  également  la  nouvelle  édition  de  cet  ouvrage,  Tubingen,  1914. 

(2)  «  D'après  les  résultats  acquis  actuellement,  dit  M.  von  Mayr,  l'applica- 
tion du  calcul  des  probabilités  n'accuse  des  indications  spéciales  quelque  peu 
satisfaisantes  —  encore  ne  s'agit-il  que  de  données  plus  ou  moins  variables 
—  que  dans  le  cas  où  les  unités  considérées  ont  plutôt  le  caractère  d'un  fait 
physique  que  d'un  fait  social;  ainsi,  la  grandeur  des  individus,  les  naissances, 
la  répartition  des  âges,  sont  de  simples  faits  naturels  qui  se  prêtent  au 
calcul.  Mais  partout  où  l'on  se  trouve  en  présence  de  faits  purement  sociaux, 
l'application  du  calcul  des  probabilités  ne  donne  rien.  Les  phénomènes  de  la 
vie  sociale  ne  sont  pas  stables  comme  ceux  de  la  nature:  ils  sont  sujets  à  un 
développement  infini  et  incalculable,  lequel  précisément  est  mis  en  évidence 
par  l'étude  des  collectivités  pratiquée  en  statistique.  La  valeur  de  l'objet  de 
cette  science  n'est  diminuée  en  rien  par  le  fait  qu'il  ne  se  laisse  pas  figer 
en  des  formules  mathématiques.  » 
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tinée  à  la  généralité  des  esprits  cultivés.  On  peut  préférer 
la  méthode  mathématique,  mais  celui  qui  n'en  possède  pas 
les  éléments  ne  doit  pas  pour  cela  renoncer  à  étudier  les 
problèmes  qui  constituent  le  domaine  de  la  statistique.  » 

52.  Ces  opinions,  si  profondément  divergentes,  ne  pa- 
raissent pas  laisser  de  place  à  un  jugement  intermédiaire. 
Nous  essayerons  cependant  de  trouver  ce  terrain  mixte 
entre  les  affirmations  des  uns  et  les-  dénégations  des  autres. 

Un  premier  point  qui  nous  semble,  à  cet  égard,  d'une 
grande  importance  est  qu'il  convient  de  distinguer  entre 
les  deux  grandes  phases  des  opérations  statistiques  :  le 
relevé  et  le  dépouillement  d'une  part,  l'exposition  et  l'in- 
terprétation d'autre  part.  C'est  une  idée  qui  se  trouve 
exposée  par  un  mathématicien-statisticien  distingué,  le  pro- 
fesseur A.  Bowley,  dans  une  étude  très  suggestive  des 
rapports  entre  la  statistique  et  les  mathématiques  (1). 

Pour  M.  Bowley,  le  travail  arithmétique  est  limité  à  la 
tabulation  des  chiffres  concrets,  là  où  le  champ  d'obser- 
vation peut  être  couvert  tout  entier,  là  où  l'approximation 
et  l'interpolation  ne  sont  pas  nécessaires  et  où  la  statistique 
ne  diffère  guère  que  par  le  nom  de  la  comptabilité.  Au  con- 
traire, les  procédés  mathématiques  permettent  de  mesurer 
ce  qui,  sans  cela,  resterait  inaccessible,  de  décrire,  comme 
en  paléontologie,  l'animal  à  l'aide  d'un  seul  de  ses  os,  d'éta- 
blir des  observations  fermes,  sur  des  bases  mouvantes. 
C'est  un  véritable  microscope  qui  permet  de  mesurer  des 
différences  que  la  méthode  arithmétique  ne  peut  apercevoir, 
c'est  un  procédé  qui  permet  de  raisonner  correctement 
d'après  les  résultats  de  la  tabulation  et  de  discerner  le  fait 
essentiel  obnubilé  dans  les  différentes  manifestations  des 
phénomènes. 


(1)  A.-L.  Bowley,  «  Address  to  the  Economie  Science  and  Statistic  section 
•of  the  British  Association  for  the  advancement  of  Science  ».  York,  1906. 
(Journal  of  the  Statistical  society,  1906.) 
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La  distinction  établie  par  M.  Bowley  est  exacte,  à  La 
condition  de  compléter  l'exposé  de  l'auteur  sur  un  point  qui 
ne  manque  pas  d'importance.  M.  Bowley  a  eu  en  vue,  d'une 
part,  les  opérations  matérielles  qu'il  compare,  non  sans 
raison,  à  une  comptabilité  (mais  de  quelle  complication!)  et, 
d'autre  part,  les  travaux  plus  savants  de  la  synthèse  des 
résultats  et  de  l'interprétation.  Cependant,  on  peut  se  de- 
mander comment  le  mathématicien  trouverait  matière  à 
ses  développements,  si  son  point  de  vue  mathématique  lui- 
même  n'avait  pas  été  à  la  base  du  travail,  si  l'on  n'avait  pas 
pris  soin  de  rassembler  des  matériaux  de  telle  nature  et  dans 
de  telles  conditions,  que  l'on  pût  formuler  plus  tard  les 
équations?  En  d'autres  termes,  il  ne  peut  jamais  exister  de 
dissociation  entre  le  travail  préliminaire  et  le  travail  final. 
Celui  qui,  sur  un  sujet  donné,  prend  la  plume  pour  tracer 
le  plan  ou  programme  des  opérations,  doit  se  demander  tout 
d'abord  à  quelles  conditions  doit  répondre  le  travail.  Si 
parmi  elles  il  s'en  trouve  —  c'est  le  cas  ordinaire  —  qui 
aient  rapport  aux  mathématiques,  l'auteur  du  plan  doit 
savoir  quels  sont  les  éléments  nécessaires  pour  établir  les 
formules  afin  que  les  recherches  à  instituer  fournissent  les 
données  réclamées  par  l'actuaire.  Ceci  est  l'évidence  même 
et  nous  ne  doutons  pas  que  telle  soit,  au  fond,  la  pensée  de 
M.  Bowley,  mais  elle  n'aura  rien  perdu  à  être  exposée  d'une 
façon  un  peu  plus  explicite. 

En  dehors  de  la  condition  générale  que  nous  venons  de 
souligner,  établir  les  bases  d'un  questionnaire,  rédiger  les 
instructions  à  l'usage  des  agents  recenseurs,  arrêter  une 
classification,  examiner  les  réponses  au  point  de  vue  de 
leur  sincérité  et  de  leur  exactitude,  dresser  les  modèles  de 
tableaux  statistiques,  dépouiller  les  résultats  de  l'enquête, 
en  consigner  les  résultats  dans  les  tableaux,  procéder  aux 
opérations  arithmétiques  qui  sont  la  suite  et  le  prolonge- 
ment naturel  du  dépouillement,  tout  cela  relève  de  l'éco- 
nomie politique  et  sociale,  de  la  méthodologie  statistique 
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générale  et  spéciale  et  de  l'arithmétique.  Mais  on  ne  peut 
rien  y  trouver  qui  appartienne  aux  mathématiques.  Il  est 
vrai  que  M.  Bowley  suppose  qu'il  ne  s'agit  pas  de  se  livrer 
à  des  calculs  d'interpolation  (1),  mais,  en  pratique,  ces  cas 
ne  se  présentent  que  rarement.  C'est  précisément  une  des 
conquêtes  de  la  statistique  moderne  d'avoir  réduit  dans  des 
limites  très  restreintes  les  cas  dans  lesquels  le  relevé  ne 
peut  porter  sur  tous  les  objets  faisant  partie  du  domaine 
de  l'observation.  Le  statisticien  professionnel,  appliqué  aux 
recherches  usuelles,  ne  se  trouve  pas,  le  plus  souvent,  dans 
l'occasion  d'appliquer  des  méthodes  relevant  du  calcul  su- 
périeur. Mais  ce  n'est  pas  un  motif  de  sous-évaluer  le  tra- 
vail auquel  il  se  livre;  l'examen  que  nous  ferons  plus  loin 
des  difficultés  de  la  statistique  pratique  montre  assez  qu'il 
ne  s'agit  pas  d'une  besogne  peu  qualifiée,  digne  d'être 
abandonnée  à  des  unskilled,  tandis  que  l'homme  de  science 
se  bornerait  à  utiliser  les  matériaux  réunis  par  des  ma- 
nœuvres. Le  divorce  entre  l 'élément  scientifique  et  l 'élément 
pratique  aurait  au  contraire  les  plus  funestes  conséquences. 

L'importance  de  la  technique  est  énorme.  N'est-ce  pas 
elle  qui  apporte  à  la  science  les  matériaux  d'étude  que 
celle-ci  réclame?  Toute  l'histoire  de  la  statistique  n 'est-elle 
pas  là  pour  montrer  qu'on  s'est  épuisé  en  efforts  pour 
améliorer  la  technique?  Et  l'œuvre  d'une  institution  comme 
l'Institut  international  de  statistique,  qu'est-elle  sinon  un 
effort  incessant  pour  améliorer  les  conditions  du  relevé 
et  de  la  tabulation? 


(1)  Le  calcul  par  interpolation'  consiste  à  rechercher,  en  l'absence  de  don- 
nées obtenues  par  l'observation  directe,  une  ou  plusieurs  mesures  intermé- 
diaires situées  entre  d'autres  résultant  du  relevé.  Il  sert  aussi  à  rectifier 
certaines  mesures  qui,  bien  qu'obtenues  par  les  recherches  statistiques,  sont 
certainement  entachées  d'erreur.  Enfin,  il  peut  être,  nécessaire,  afin  de  com- 
parer entre  elles  des  statistiques  qui  ne  sont  pas  présentées  d'après  une  même 
base  ou  échelle. 

L'interpolation  peut  être  faite  par  un  procédé  graphique  ou  par  l'algèbre 
(calcul  différentiel  ) . 
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Quel  serait  le  rôle  des  mathématiques  clans  l'interpréta- 
tion? C'est  encore  à  M.  Bowley  que  nous  demanderons  la 
réponse.  On  peut,  dit-il,  concevoir  l'application  des  mathé- 
matiques à  la  statistique  comme  un  instrument  de  précision 
dont  l'usage  a  pour  but  de  faire  apparaître  des  points  qui, 
sans  cela,  resteraient  obscurs.  C'est  dans  ce  sens  qu'il  com- 
pare la  méthode  mathématique  au  microscope,  tandis  que 
l'arithmétique  ne  dépasserait  pas  la  portée  de  l'œil  de 
l 'observàteur.  On  peut  dire  aussi  que  l'emploi  des  mathé- 
matiques supplée  au  défaut  d'observation,  au  manque  de 
continuité  dans  une  observation  commencée,  interrompue  et 
reprise  ensuite.  Enfin,  ainsi  qu'il  ressort  à  toute  évidence 
de  la  critique  des  procédés  statistiques,  le  matériel  réuni  est 
habituellement  imparfait  et  sa  mise  en  œuvre  ne  va  pas 
sans  courir  quelques  chances  d'erreur;  si  excellents  que 
soient  les  procédés  techniques,  il  faut  toujours  compter 
avec  les  erreurs  commises  par  les  aides  nombreux,  à  la 
collaboration  desquels  il  faut  recourir  pour  la  mise  en 
œuvre  de  tout  matériel  un  peu  important.  Or,  le  matériel 
étant  imparfait,  c'est  une  des  exigences  du  travail  scienti- 
fique de  faire  disparaître  ses  tares  dans  la  plus  large  me- 
sure possible  ou  d'évaluer  avec  précision  celles  que  nous  ne 
parvenons  pas  à  éliminer.  C'est  surtout  dans  ces  deux  direc- 
tions, dit  M.  Bowley,  que  les  méthodes  des  mathématiques 
sont  généralement  nécessaires.  Le  matériel  est  mis  à 
l'épreuve  par  les  méthodes  d'interpolation  et  de  gradua- 
tion. La  loi  générale  de  groupement  et  de  direction  du  mou- 
vement est  découverte  et  les  variations  accidentelles  sont 
éliminées,  ou  inversement,  la  direction  générale  est  neutra- 
lisée et  les  variations  accidentelles  mesurées. 

Le  rôle  des  mathématiques  dans  la  statistique  consiste- 
rait donc  :  a)  à  combler  les  lacunes  de  relevé:  b)  à  amé- 
liorer les  résultats  de  l'observation  et  à  évaluer  la  grandeur 
«les  erreurs  qui  ne  peuvent  être  corrigées;  c)  à  affiner  les 
conclusions  de  l'interprétation  en  faisant  apparaître  des 
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éléments  qui,  autrement,  resteraient  inconnus  ou  imparfai- 
tement connus. 

53.  Il  est  intéressant  de  reprendre  en  détail  à  cet  endroit 
les  objections  que  Mayr  adresse  aux  mathématiciens. 

Pour  le  premier  point,  Mayr  se  borne  à  remarquer, 
succinctement,  que  le  champ  d 'application  ouvert  aux  ma- 
thématiques se  restreint  de  plus  en  plus,  grâce  au  caractère 
toujours  plus  complet  et  plus  général  des  observations  pri- 
maires; quant  à  l'extrapolation,  elle  n'a  d'autre  impor- 
tance que  celle  qu'on  peut  attacher  à  d'ingénieuses  combi- 
naisons, sans  grande  portée  pratique  (1). 

On  emploie  les  mathématiques  pour  découvrir  les  erreurs 
accusées  par  l'observation,  mais  le  mot  «  erreur  »  a  ici  un 
sens  particulier.  Il  est  un  point,  dit  cet  auteur,  qu'en 
tout  cas  l'étude  la  plus  attentive  par  les  mathématiques 
pures  est  incapable  d'élucider  :  c'est  de  savoir  s'il  s'agit 
d'erreurs  matérielles  de  l'observation,  ou  si  ces  écarts,  qui 
paraissent  des  erreurs  au  sens  des  mathématiques,  ne  sont 
pas  simplement  des  écarts  que  présente  la  réalité  par  rap- 
port à  une  normale  théorique  (2). 

Ce  langage  semble  inspiré  par  quelque  parti-pris,  il  ne 
paraît  pas  concorder  très  exactement  avec  la  réalité  des 
choses.  Les  procédés  d'interpolation  rendent  d'incontes- 
tables services  dans  tous  les  cas,  fréquents  en  statistique, 
où  il  s'agit  d'éliminer  l'effet  de  causes  constantes  pour 
laisser  apparaître  seulement  celui  des  causes  secondaires 
et  accidentelles.  Des  rapports  de  grandeur  et  de  variabilité 
ne  peuvent  parfois  être  mis  en  lumière  d'une  façon  com- 
plète qu'à  l'aide  de  procédés  mathématiques.  Enfin,  il  n'est 
pas  niable  que  dans  l'interprétation,  le  statisticien  puisse 
recueillir  des  avantages  sérieux  de  la  connaissance  des 
mathématiques. 


(1)  von  Mayr,  loc.  cit.,  paragr.  15,  n°  2. 

(2)  Ibid.,  paragr.  15,  n°  5. 
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En  conclusion,  la  thèse  négative  pure  et  simple,  telle 
qu'elle  est  professée  par  plusieurs  auteurs,  ne  paraît 
pas  soutenable  dans  les  circonstances  actuelles.  Etant 
données  les  applications  des  mathématiques  à  la  sta- 
tistique, il  n'est  pas  possible  de  s'en  désintéresser. 
La  formule  de  Ferraris,  qui  souhaite  que  chaque  statisti- 
cien ait  une  connaissance  suffisante  (una  discret®  cultura) 
des  sciences  mathématiques,  peut  être  considérée  comme  un 
minimum,  même  à  l'égard  de  l'organisateur  professionnel 
des  recensements  et  des  enquêtes. 

54.  En  effet,  il  n'est  pas  douteux  que  les  procédés  mathé- 
matiques sont  de  nature  à  élucider  bon  nombre  de  pro- 
blèmes; ils  font  dès  lors  partie  intégrante  de  la  technique 
et  le  statisticien  doit  être  à  même  d'y  recourir^  comme  il 
recourt  aux  procédés  techniques  d'autre  nature.  Lorsque  la 
technique  d'une  science  évolue,  nul  n'a  le  droit  de  se  désin- 
téresser des  acquisitions  nouvelles  dûment  éprouvées. 
Que  dirait-on  d'un  biologiste  qui,  obstinément  fidèle 
aux  méthodes  qui  lui  furent  enseignées  durant  sa  jeu- 
nesse, refuserait  d'appliquer,  même  de  connaître,  les 
procédés  techniques  nouveaux  découverts  depuis?  Le 
statisticien  qui  fermerait  les  yeux  à  l'évidence,  se  mettrait 
dans  une  situation  peu  défendable.  Bien  entendu,  il 
y  a  des  degrés  résultant  de  la  nature  des  choses;  on 
pourra  demander  davantage  au  démographe  qu'au  statisti- 
cien économiste,  par  exemple.  Ce  qui  est  hors  de  doute, 
c'est  que  chaque  statisticien  doit  posséder  l'esprit  mathé- 
matique, cette  disposition,  peut-être  indéfinissable,  qui  fait 
que  l 'on  se  rend  compte  de  l 'exactitude  mathématique  d 'une 
proposition  et  que  l'on  suit  avec  intérêt  les  développements 
donnés  par  les  techniciens.  Ni  l'éloignement  ni  l'indiffé- 
rence ne  sont  plus  de  mise  ;  les  mathématiques  ont  fait  leurs 
preuves,  elles  font  partie  de  la  technique;  on  ne  peut  plus 
s'en  désintéresser,  car  il  serait  contraire  à  l'esprit  scien- 
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tifique  de  laisser  à  l'abandon  une  parcelle  quelconque  de  la 
méthode  capable  de  conduire  à  la  vérité. 

55.  Une  autre  question  surgit  aussitôt.  Dans  quelle  mesure 
cette  méthode  est-elle  «  indispensable  »  ?  On  peut  répondre, 
nous  paraît-il,  qu'elle  n'est  pas  toujours  «  indispensable  », 
tout  en  étant  très  souvent  utile.  D'après  les  termes  mêmes 
du  problème,  tel  qu'il  a  été  posé  par  M.  Bowley  dans  son 
adresse  présidentielle  à  la  British  Association,  en  1906, 
l'un  des  buts  essentiels  de  la  méthode  mathématique  con- 
sisterait à  combler  les  lacunes  du  relevé.  Mais  une  objec- 
tion peut  être  faite  :  les  mathématiques  ne  sont  pas  de  la 
divination;  lorsqu'elles  essayent  de  suppléer  au  relevé,  — 
soit  que  celui-ci  soit  incomplet  ou  qu'il  soit  discontinu,  ou 
que  l'on  tente  de  transporter  dans  l'avenir  les  conclusions 
pour  le  présent,  —  on  part  toujours  de  ce  postulat  que  les 
conditions  connues  s 'appliquent  aux  phénomènes  restés  en 
dehors  du  relevé;  or,  c'est  précisément  ce  qu'on  ignore.  Le 
plus  souvent,  on  se  trouve  en  présence  de  faits  essentielle- 
ment variables  et  différents  les  uns  des  autres  :  de  la  gran- 
deur des  uns,  bien  connue,  on  ne  peut  conclure  à  la  gran- 
deur des  autres,  qui  est  inconnue.  Ne  trouve-t-on  pas  plus 
de  garanties  dans  la  tendance,  si  accentuée  aujourd'hui, 
d'étendre  le  relevé  à  toutes  les  unités?  Vérifier  si  les  résul- 
tats du  relevé  sont  complets,  s'ils  ne  présentent  pas  de  trop 
grandes  divergences  avec  les  résultats  antérieurement 
recueillis,  comparer  les  déclarations  des  ouvriers  avec 
celles  des  patrons,  veiller  à  éliminer  les  multiples 
emplois  si  faciles  à  commettre  quand  plusieurs  personnes 
peuvent  se  croire  qualifiées  pour  répondre  au  questionnaire, 
—  toutes  ces  précautions  concourent  au  même  but  :  s'as- 
surer que  le  relevé  est  complet,  empêcher  que  la  même  unité 
ne  soit  comptée  plusieurs  fois.  Elles  exigent  de  la  patience, 
du  travail,  de  l'expérience,  mais  elles  n'ont  rien  à  voir  avec 
les  mathématiques.  Ceci  ne  signifie  pas  que  la  méthode  un- 
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thématique  est,  dans  ce  cas,  inutile  ou  mauvaise,  mais  sim- 
plement qu'elle  n'est  pas  toujours  indispensable. 

56.  L'emploi  des  procédés  mathématiques  peut  avoir  un 
troisième  but  :  celui  d'affiner  les  conclusions  de  l'inter- 
prétation en  faisant  apparaître  des  éléments  qui,  autrement, 
resteraient  en  tout  ou  en  partie  inconnus.  C  'est  cette  fonc- 
tion des  méthodes  mathématiques  que  M.  Bowley  compare 
à  l'emploi  du  microscope  et  c'est  à  propos  d'elles  qu'il  dit 
que  la  méthode  arithmétique  n'a  qu'une  portée  relative 
comme  une  observation  faite  à  l'œil  nu  ne  nous  révèle  qu'un 
aspect  incomplet  des  choses. 

La  légitimité  de  l'emploi  des  méthodes  mathématiques 
dans  le  sens  indiqué  n'est  pas  contestable,  mais  son  usage 
judicieux  présente  de  sérieuses  difficultés.  C  'est  ici  surtout 
qu'est  exacte  la  parole  de  Bodio  qui  craint  de  voir 
employer,  pour  l'amour  de  l'art,  le  trébuchet  du  peseur 
d'or  quand  on  ne  devrait  recourir  qu'à  la  balance  grossière 
du  marchand.  Les  applications  parfois  subtiles  qu'on  fait 
du  calcul  supérieur  cadrent  mal  avec  l'aspect  fruste  des 
données  numériques.  Avec  les  résultats  des  statistiques, 
nous  nous  trouvons  dans  le  domaine  du  relatif,  avec  le  calcul 
mathématique,  nous  sommes  dans  la  sphère  de  l'absolu; 
existe-t-il  entre  ces  deux  aspects  des  choses  un  pont  solide 
qui  permette  de  passer  de  l'un  à  l'autre?  Il  sera  toujours 
sage  de  poser  la  question. 

Il  n'en  reste  pas  moins  vrai  que  les  procédés  arithmé- 
tiques ne  permettent  pas  toujours  de  discerner  toutes  les 
faces  d'une  question.  Ainsi  que  nous  le  montrerons  plus 
loin,  les  relations  qui  existent  entre  les  manifestations 
quantitatives  de  deux  phénomènes  ne  sont  complètement 
mises  en  lumière  qu'avec  l'aide  du  calcul  des  corréla- 
tions. M.  Udny  Yule  considère  la  méthode  de  corrélation 
comme  fondée  sur  la  formation  d'équations  donnant  la 
valeur  d'une  variable  en  fonction  d'une  ou  de  plusieurs 
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antres.  La  méthode  de  corrélation  consisterait  donc  à  déter- 
miner le  degré  d'affinité  qui  unit  entre  eux  deux  ou  plu- 
sieurs éléments  dont  les  relations  sont  susceptibles  de 
mesure.  Lorsque  ces  éléments  sont  unis  entre  eux  par  des 
rapports  de  grandeurs,  le  degré  de  persistance  de  la  relation 
qui  existe  entre  ces  grandeurs  caractérise  entre  elles  le 
degré  de  corrélation.  Les  éléments  sont  alors  appelés  fonc- 
tions les  uns  des  autres,  c'est-à-dire  qu'il  existe  respecti- 
vement entre  eux  une  dépendance  plus  ou  moins  parfaite 
qui  les  fait  varier  de  grandeur  en  raison  des  variations 
subies  par  les  autres  éléments  dont  ils  sont  fonctions. 

La  méthode  de  corrélation  est  essentiellement  mathéma- 
tique, elle  ne  peut  être  remplacée  par  aucune  opération  de 
l'arithmétique.  A  ce  point  de  vue,  il  est  exact  que  les  pro- 
cédés mathématiques  font  apparaître  des  résultats  qui, 
sans  eux,  ne  pourraient  être  mis  en  lumière. 


CHAPITRE  IV 
Division  de  la  matière. 

57.  Il  semble  que  nous  sommes  arrivés  au  point  où  la 
matière  peut  se  diviser  d'après  des  caractères  logiques. 

En  premier  lieu,  nous  distinguons  la  statistique 
méthodologique,  qui  comprend  l'ensemble  des  procédés  par 
lesquels  on  parvient  à  la  connaissance  des  phénomènes  col- 
lectifs sans  distinction  de  leur  nature.  Qu'il  s'agisse  de  faits 
sociaux,  biologiques  ou  physiques,  les  observations  se  font 
au  moyen  du  relevé,  sont  soumises  à  la  critique,  sont  expo- 
sées dans  des  tableaux,  puis  condensées  en  formules  abré- 
viatives  et,  enfin,  interprétées  selon  les  mêmes  procédés  lo- 
giques. Sans  doute,  les  modalités  diffèrent  selon  la  nature 
des  objets,  mais  pour  le  fond,  la  méthode  reste  identique. 
On  ne  saurait  trouver  de  distinction  logique  entre  un  relevé 
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des  jours  de  pluie,  le  dénombrement  du  bétail  et  un  recen- 
sement de  l'activité  économique  de  la  population.  Ce  qui 
sépare  ces  travaux  —  en  ne  considérant  que  le  problème 
méthodologique  —  c'est  surtout  le  degré  de  difficulté  que 
leur  exécution  peut  présenter.  Dans  le  premier  cas,  le  plu- 
viomètre fournira  peut-être  des  indications  suffisamment 
précises,  on  se  bornera  à  noter  régulièrement  les  résultats 
enregistrés  par  l'instrument,  relevé  commode  et  sûr, 
auquel  on  peut  assimiler  certaines  formes  du  relevé 
automatique  (1).  S'agit-il  de  compter  le  bétail?  La 
chose  est  plus  compliquée,  car  il  faut  en  venir  à  un  comp- 
tage des  unités;  nulle  opération  de  l'espèce  ne  va  sans 
quelque  risque  d'erreur  :  omissions,  ou,  par  contre, 
double  emploi,  inattention  des  employés,  erreurs  de 
calcul,  etc.  Mais,  comme  ce  n'est  qu'un  comptage  par 
espèce,  il  s'agit  d'une  opération  d'une  difficulté  médiocre. 
En  vient-on  au  contraire  au  recensement  professionnel  ? 
Voilà  que  surgissent  bien  d'autres  problèmes!  Les  qualités 
économiques  sont  ardues  à  définir,  plus  difficiles  encore  à 
discerner;  il  ne  faut  que  peu  de  chose  —  un  mot  mal  em- 
ployé, une  expression  à  double  entente  —  pour  faire  naître 
de  graves  méprises;  les  risques  d'omission  ou  de  répétition 
sont  nombreux;  de  plus,  ils  passent  facilement  inaperçus. 
Voilà  pour  les  différences.  Elles  sont  notables.  Mais,  en 
somme,  la  base  reste  toujours  la  même  :  c'est  le  relevé, 
c'est-à-dire  «  l'observation,  unité  par  unité,  des  manifes- 
tations individuelles  d'un  phénomène  et  des  conditions  de 
toutes  ses  manifestations  ». 

La  statistique  méthodologique  est  donc  générale  par  son 
objet.  Elle  résume  la  technique  particulière  de  la  méthode, 
trace  la  voie  à  suivre,  indique  les  précautions  à  prendre 
pour  arriver  à  de  bons  résultats,  peu  importe  la  nature  des 
faits  auxquels  on  l'applique. 


(1)  Cfr.  livre  I,  1"  section,  eh.  I,  §  III. 
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58.  A  côté  de  la  statistique  méthodologique,  nous  plaçons 
la  statistique  descriptive.  On  a  essayé  à  différentes  reprises 
d'en  tracer  un  plan  systématique.  Ferraris,  par  exemple, 
considérant  la  société  humaine  comme  un  organisme  qui  se 
reproduit,  se  développe  et  meurt,  a  proposé  la  division  sui- 
vante (1)  : 

I.  Notions  préliminaires  comprenant  l'étude  anthropométrique  et  psychique 
de  l'individu. 

II.  Production  de  la  vie  (nuptialité,  natalité,  divorce,  naissances  illégi- 
times, mort-nés) . 

III.  Distribution  de  la  vie  (densité  de  la  population). 

IV.  Circulation  de  la  vie  (mouvement  de  la  population,  enseignement, 
religion). 

V.  Consommation  de  la  vie  (maladies,  suicides,  criminalité). 

VI.  Epilogue  (augmentation  ou  diminution  de  la  population,  libre  arbitre 
individuel) . 

Messedaglia  se  rapproche  beaucoup  de  Quetelet  (2)  dans 
les  divisions  suivantes  qu'il  propose  d'adopter  pour  l'étude 
et  le  partage  des  matières  à  considérer  par  la  statistique  : 

I.  Territoire  ou  topographie. 

II.  Population  ou  démographie. 

III.  Vie  économique  :  agriculture,  industrie,  commerce,  voies  et  moyens 
de  communication. 

IV.  Vie  intellectuelle  :  instruction  publique  à  tous  les  degrés,  presse,  biblio- 
thèques, etc. 

V.  Vie  morale  :  criminalité,  prostitution. 

VI.  Vie  politique  :  statistique  judiciaire,  financière,  militaire,  électorale,  etc. 

59.  Nous  pensons  qu'il  convient  de  réserver  une  place 
spéciale  à  la  démographie.  Pour  beaucoup  de  personnes,  la 
démographie  est  inséparable  d'un  exposé  réservé  à  la  sta- 
tistique méthodologique.  On  la  considère  souvent  comme  le 
prolongement  nécessaire,  obligé  de  celle-ci,  comme  si  la 
méthodologie  formait  la  partie  générale,  la  démographie  la 
partie  appliquée  ou  spéciale  d'une  science  unique  :  la  sta- 
tistique. C'est  une  erreur.  Levasseur  a  parfaitement  mis 


(1)  C.  Ferraris,  La  statistica;  le  sue  partizioni  teoretiche.  Venezia,  1890 

(2)  Cf.  plus  haut,  n°  10. 
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en  lumière  le  caractère  propre  de  la  démographie  :  «  Il  y  a, 
dit-il,  une  étude  qui  constitue  assurément  une  science  et  qui 
est  si  étroitement  liée  avec  la  statistique,  qu'on  l'a  con- 
fondue souvent  avec  elle  :  c'est  la  démographie.  On  a  dési- 
gné et  on  désigne  encore  la  démographie  sous  le  nom  de 
«  statistique  de  la  population  »,  expression  à  peu  près 
exacte,  quoique  un  peu  étroite,  ou  simplement  de  «  statis- 
tique »,  expression  inexacte.  La  démographie  est  la  science 
de  la  population;  elle  en  constate  l'état,  elle  en  étudie  les 
mouvements,  principalement  dans  la  naissance,  le  mariage, 
la  mort  et  dans  les  migrations,  et  elle  s'efforce  de  parvenir 
jusqu'à  la  connaissance  des  lois  qui  la  régissent.  C'est  la 
science  de  la  vie  humaine  dans  l'état  social;  c'est  bien  réel- 
lement une  science  dans  le  sens  que  nous  donnons  à  ce 
mot,  puisqu'elle  a  un  objet  distinct,  nettement  déterminé. 
<(  Si  elle  a  été  parfois  confondue  avec  la  statistique,  c'est 
que  cette  dernière  est  la  méthode  par  laquelle  elle  procède 
dans  la  plupart  de  ses  investigations  et  la  mine  de  laquelle 
elle  tire  la  plupart  de  ses  matériaux  (1).  » 

Ces  deux  dernières  observations  de  Levasseur,  qui  ont 
rencontré  l'adhésion  d'un  grand  nombre  d'auteurs,  sont 
frappées-  au  coin  du  bon  sens.  La  démographie  ayant  son 
objet  propre,  sa  sphère  parfaitement  délimitée,  est  une 
science  qui  se  sépare  nettement  de  la  statistique  méthodo- 
logique. 'Si  la  statistique  lui  fournit  la  plupart  de  ses  don- 
nées, elle  ne  les  lui  procure  pas  toutes.  La  démographie 
fait  de  larges  emprunts  aux  sciences  anthropologiques  et 
biologiques,  aux  sciences  politiques  et  administratives,  aux 
sciences  juridiques  et  économiques.  En  ne  se  soumettant 
pas  à  une  méthode  unique,  elle  achève  de  se  classer  parmi 
les  sciences  et  se  sépare  des  disciplines  qui  n'utilisent  qu'un 
seul  procédé  de  recherche. 


(1)  E.  Levasseur,  La  population  française,  t.  I,  p.  18.  Pam,  Rous- 
seau, 1889. 
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On  pourrait  en  dire  autant  des  recherches  désignées  sous 
le  nom  de  statistique  morale.  Ses  relations  avec  la  démo- 
graphie sont  étroites,  mais  au  lieu  de  l'état  et  du  mouve- 
ment de  la  population,  la  statistique  morale  envisage  cer- 
taines actions  humaines  sous  le  rapport  de  l'éthique.  Les 
divorces,  les  suicides,  la  criminalité,  la  folie,  3a  prostitu- 
tion, sont  les  principaux  sujets  de  ses  recherches.  On  a  pro- 
posé de  la  définir  :  «  l'étude  statistique  de  l'immoralité,  du 
désordre  moral(l)  ».  Elle  a  donc  bien  aussi  son  objet  propre, 
son  objectif  spécial  et  limité;  si,  comme  la  démographie, 
elle  fait  surtout  appel  à  la  méthode  statistique,  celle-ci  n'est 
pas  seule  à  lui  fournir  son  concours.  Pour  apprécier  le 
phénomène  collectif  qu'on  désigne  sous  le  nom  de  statis- 
tique morale,  il  ne  suffit  pas  de  la  statistique,  mais  il  faut 
encore  utiliser,  dans  une  large  mesure,  l'anthropologie, 
la  psychologie  et  le  droit.  Un  objet  particulier,  un  faisceau 
de  méthodes  concordantes  vers  un  but  unique  assurent  à  la 
statistique  morale,  au  même  degré  qu'à  la  démographie,  le 
caractère  de  la  science. 

60.  En  dehors  de  ces  deux  sciences  bien  définies,  la  dé- 
mographie et  la  statistique  morale,  il  reste  une  masse 
énorme  de  matière  qui  constitue  la  statistique  descriptive 
à  proprement  parler.  On  peut  la  diviser  en  statistique  du 
territoire,  statistique  économique,  statistique  de  la  vie  intel- 
lectuelle, politique,  administrative,  statistique  appliquée 
aux  phénomènes  physiques,  aux  caractères  biologiques,  etc. 

Ce  qui  caractérise  la  statistique  descriptive,  c'est  d'abord 
son  étendue  qui  interdit  au  chercheur  isolé  d'embrasser 
la  matière  dans  son  ensemble.  C'est  ensuite  la  prédomi- 
nance du  point  de  vue  méthodologique  sur  les  résultats 
concrets.  Ceux-ci  sont  sujets  à  d'infinies  modifications  que 


(1)  Camille  Jacquart.  «  Essais  de  statistique  morale.  La  criminalité  belge 
1868-1909  »,  p.  5.  (Extrait  des  Annales  de  l'Institut  supérieur  de  philosophie) , 
Louvain.  1912. 
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la  statistique  doit  relever  avec  patience  et  commenter  avec 
sagacité.  Mai»  dans  un  travail  consacré  aux  procédés  sta- 
tistiques, il  semble  bien  que  le  problème  méthodologique  se 
pose  avant  tout  autre  :  montrer  comment  on  fait  de  bonnes 
observations  dans  une  sphère  nettement  définie  est  chose 
plus  importante  que  de  rassembler  dans  des  tableaux,  à  coup 
sûr  ingénieux,  mais  d'un  intérêt  tout  momentané,  des  ré- 
sultats dont  la  comparabilité  est  parfois  douteuse.  Il  semble 
donc  que  la  statistique  descriptive  ait  à  se  proposer  de 
noter  l'évolution  des  méthodes  et  les  acquisitions  de  la 
science  au  lieu  de  ne  viser  qu'à  réunir  des  tableaux  de 
chiffres  et  à  en  tirer  des  commentaires. 

Nous  exposerons  en  premier  lieu  les  principes  de  la  sta- 
tistique méthodologique,  puis  nous  en  verrons  les  princi- 
pales applications  à  la  statistique  économique  et  à  la  sta- 
tistique du  travail.  Cet  ouvrage  se  divise  donc  en  deux 
parties  :  la  première,  consacrée  à  la  méthodologie,  est  gé- 
nérale; la  seconde,  qui  concerne  la  statistique  économique, 
est  spéciale. 

Nous  plaçant  surtout  au  point  de  vue  méthodologique, 
nous  ne  traiterons  point  des  deux  sciences  dont  nous  avons 
reconnu  l'existence  indépendante  :  la  démographie  et  la  sta- 
tistique morale.  Ces  sciences  ont  du  reste  fait  l'objet  de 
nombreux  et  savants  travaux. 
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LIVRE  PREMIER 
TECHNIQUE  DU  RELEVÉ  STATISTIQUE 

PREMIERE  SECTION 
Le  relevé  statistique  ou  relevé  direct. 

CHAPITRE  PREMIER 

Généralités,  Définition,  Division. 
I.  - —  Définition  du  relevé  statistique. 

62.  La  statistique  est  une  méthode  scientifique  basée  sur 
l'observation;  elle  relève  entièrement  de  l'induction  : 
elle  part  de  faits  constatés  d'après  des  règles  spéciales; 
elle  raisonne  sur  des  groupes  homogènes  formés  à 
l'aide  des  phénomènes  qu'elle  considère;  elle  s'efforce 
ensuite  de  parvenir  à  la  connaissance  générale  des  ten- 
dances et  des  régularités  qui  se  manifestent  parmi  les  faits 
collectifs.  La  première  phase  de  toute  opération  statistique 
consiste  donc  dans  la  préparation,  l'exécution  et  la  centra- 
lisation des  observations  faites  sur  les  phénomènes  col- 
lectifs. 

La  recherche  statistique  porte  un  nom  spécial  :  on  l'ap- 
pelle le  relevé  statistique  et  ce  terme  convient  mieux  que 
celui  d'observation,  qui  a  été  parfois  employé.  L '.observa- 
tion est  la  forme  intellectuelle  de  l'attention;  même  elle 
est  sa  forme  scientifique,  car  l'observation  n'a  sa  raison 
d'être  que  dans  le  désir  de  connaître,  de  vérifier  des  idées 
générales.  Elle  se  distingue  nettement  de  l'expérience,  par 
le  caractère  propre  de  sa  méthodologie  :  l'observation  est 
l'examen,  l'investigation  des  phénomènes  tels  qu'ils  sont, 
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—  l'expérience  est  l'investigation  d'un  phénomène  modifie 
par  l'expérimentateur  (1).  Or,  si  nous  examinons  le  pro- 
cessus statistique,  pouvons-nous  dire  qu'il  est  un  procédé 
d'observation!  A  proprement  parler,  le  statisticien  n'ob- 
serve pas  ;  il  se  borne  à  utiliser  des  observations  faites  par 
d'autres,  sous  sa  direction,  ce  qui  exclut  le  caractère  d'at- 
tention personnelle  se  trouvant  à  la  base  de  l'observation 
scientifique. 

Cette  raison  ne  paraît  cependant  pas  entièrement  déci- 
sive. Il  suffit  d'étendre  un  peu  le  sens  du  mot  «  statisti- 
cien »,  et  d'y  comprendre  les  agents  du  relevé,  pour  ré- 
pondre à  l'objection;  d'ailleurs,  les  agents  employés  aux 
observations  statistiques  n'agissent  que  d'après  l'impul- 
sion et  selon  les  méthodes  de  l'organisateur  de  la  recherche, 
leur  travail  est  simplement  une  projection  du  sien.  Mais 
il  y  a,  semble-t-il,  une  meilleure  raison  de  préférer  le  mot 
de  relevé  à  celui  d'observation.  Comme  forme  de  l'inves- 
tigation scientifique,  l'observation  doit  pouvoir  considérer 
tous  les  aspects  extérieurs  des  choses  auxquelles  elle  s'ap- 
plique. Or,  il  n'en  est  pas  ainsi  dans  l'observation  sta- 
tistique :  elle  peut  relever  seulement  certains  caractères 
des  faits,  ceux  susceptibles  d'être  exprimés  sous  une  forme 
numérique.  Tous  les  autres  lui  échappent  ou,  tout  au  moins, 
ils  ne  peuvent  prendre  place  dans  les  colonnes  de  nombres 
dont  sont  formées  les  publications  statistiques.  Aussi, 
ne  peut-on  faire  la  statistique  des  actions  immorales,  mais 
seulement  celle  des  actions  déclarées  immorales  par  la 
la  loi,  les  infractions  qui,  parvenues  à  la  connaissance  de  la 
justice,  ont  été  l'objet  d'une  décision  coulée  en  force  de 
chose  jugée  (2). 


(1)  CLAUDE  Bernakd.  Introduction  à  l'étude  de  la  médecine  expérimentale 
(première  partie,  chap.  1). 

(2)  Non  seulement  les  actes  immoraux,  mais  même  les  délits  dont  les 
auteurs  sont  restés  inconnus,  ne  sont  pas  compris  dans  la  statistique. 
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Le  moraliste  qui  se  livrerait  à  l'étude  de  la  criminalité 
voudrait  connaître  toute  l'étendue  de  ce  phénomène;  non 
seulement  la  criminalité  réprimée  par  les  tribunaux,  mais 
encore  celle  qui  a  échappé  à  la  justice;  non  seulement  la 
criminalité  légale,  mais  aussi  celle  qui  se  cache  sous  les 
dehors  de  la  correction  de  la  vie  sociale.  La  statistique  doit 
renoncer  à  cette  ambition  :  elle  ne  connaît  que  les  nombres, 
elle  ne  fait  que  compter. 

L'investigation  faite  en  vue  de  la  statistique  n'est  donc 
pas  une  application  complète  de  l'observation  scientifique; 
elle  est  limitée  dans  son  objet  et,  dès  lors,  elle  ne  peut  se 
confondre  avec  un  procédé  logique  aussi  général  que  l'ob- 
servation proprement  dite.  C  'est  la  raison  pour  laquelle  un 
terme  spécial,  celui  de  relevé,  convient  mieux  pour  désigner 
le  procédé  statistique  dans  la  phase  où  il  s'applique  à  déter- 
miner les  caractères  des  phénomènes. 

Nous  définissons  le  relevé  :  «  l'investigation,  unité  par 
unité,  portant  sur  les  manifestations  individuelles  d'un  phé- 
nomène et  les  conditions  de  toutes  ses  manifestations  ». 

II.  —  Limites  de  l'application  du  procédé. 

63.  L'application  de  la  méthode  n'étant  possible  qu'à  la 
condition  que  se  trouvent  réunies  certaines  conditions  gé- 
nérales, il  semble  rationnel  de  consacrer  d'abord  quelques 
lignes  à  l'exposé  de  ces  conditions. 

En  premier  lieu,  la  recherche  à  taire  ne  peut  heurter  les 
sentiments  intimes  de  ceux  qu'elle  concerne,  elle  ne  doit 
pas  faire  naître  parmi  eux  des  appréhensions  de  nature  à 
altérer  la  sincérité  des  réponses.  L'oubli  de  ces  mobiles 
d'ordre  psychologique  est  de  nature  à  altérer  gravement  la 
valeur  du  relevé  statistique.  Dans  les  recherches  démogra- 
phiques, les  chances  de  heurter  les  sentiments  intimes  sont 
relativement  peu  nombreuses,  les  questions  posées  aux 
citoyens  ne  pouvant  guère  provoquer  de  susceptibilités  : 
le  sexe,  l'état  civil,  l'âge,  la  profession...  Certaines  de- 
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mandes  des  recensements  démographiques  n'échappent 
cependant  pas  entièrement  à  cette  cause  d'erreur.  Le  nom- 
bre de  personnes  mariées  ne  serait-il  pas  plus  grand 
d'après  le  recensement  que  d'après  les  relevés  de  l'état 
civil!  Certaines  personnes  sans  profession  avouable  n'en 
indiquent-elles  pas  une  autre  pour  les  besoins  de  la  cause  ? 

Lorsqu'on  introduit  dans  un  recensement  des  questions 
touchant  au  domaine  de  la  conscience,  on  risque  de  faire 
fausse  route;  telle  est  la  demande  qui  fut  formulée  dans 
l'un  des  derniers  recensements  italiens,  à  peu  près  en  ces 
ternies  :  «  A  quel  culte  appartenez-vous?  »  La  question,  a 
fait  remarquer  un  auteur,  est  à  double  entente.  On  peut 
appartenir  à  un  culte  en  ce  sens  qu'on  est  né  dans  ce  culte, 
qu'on  y  a  été  élevé,  qu'on  en  a  même  rempli  des  obligations 
essentielles,  sans  toutefois  le  pratiquer  encore.  S'il  s'agis- 
sait de  s'informer  des  pratiques  religieuses  actuelles  des 
recensés,  l'inconvénient  était  encore  plus  grave,  car  la  ques- 
tion, en  ce  cas,  aurait  été  directement  à  l 'encontre  de  la 
règle  qui  place  en  dehors  de  la  statistique  le  domaine  de  la 
conscience.  Dans  les  recherches  relatives  aux  choses  de  la 
vie  économique,  apparaît  souvent  le  danger  de  heurter  trop 
directement,  par  des  questions  indiscrètes,  le  sentiment  de 
l'intérêt  personnel.  Déjà  en  1846,  Quetelet  écrivait  ces 
•lignes,  encore  vraies  aujourd'hui  :  «  Si  l'on  croit  recon- 
naître dans  des  questions  un  but  fiscal  ou  une  curiosité 
inquisitoriale,  l 'on  ne  se  fera  pas  de  scrupule  de  donner  des 
réponses  inexactes  (1).  » 

Il  n'est  pas  toujours  possible  d'éviter  complètement  que 
certaines  investigations  ne  paraissent  aller  à  l 'encontre 
de  l'intérêt  personnel  ou  collectif  des  recensés.  Dans  ce  cas, 
on  s'efforce,  au  moyen  d'une  revision  attentive  du  matériel 
statistique,  de  faire  disparaître,  ou  d'atténuer  dans  une 


(1)  Quetelet.  Lettres  sur  la  théorie  des  probabilités,  p.  290. 
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mesure  notable,  les  sources  d'erreurs  possibles:  nous  par- 
lerons de  ces  procédés  lorsque  nous  examinerons  les  moyens 
employés  par  la  critique  statistique.  Bornons-nous 
à  retenir  ici  cette  règle  essentielle  :  dans  une  enquête 
statistique,  il  y  a  un  danger  réel  à  heurter  de  front 
des  défiances  profondément  ancrées  dans  l 'esprit  du  public, 
ou  à  employer  des  moyens  d'investigation,  dont  la  nature 
même  ferait  naître  de  telles  défiances.  Organiser  auprès 
des  chefs  d'entreprise  une  enquête  statistique  sur  les  heures 
de  travail  des  ouvriers  adultes,  en  faisant  recueillir  les 
données  par  les  inspecteurs  du  travail,  revient  à  peu  près 
à  affirmer  les  sympathies  du  gouvernement  à  l'égard  d'une 
extension  de  la  réglementation  de  la  durée  du  travail  à  une 
catégorie*  de  personnes  non  assujetties  encore  à  de  pa- 
reilles restrictions.  La  sincérité  des  réponses  données  par 
les  patrons  pourrait,  à  bon  droit,  paraître  douteuse. 

64.  A  ces  causes,  d'ordre  psychologique,  limitant  la  por- 
tée du  relevé,  s'ajoutent  des  raisons  d'ordre  administratif 
et  pratique. 

Le  temps  à  consacrer  à  une  recherche  déterminée  peut 
paraître  trop  long  par  rapport  à  l'intérêt  qu'elle  présente. 
Dans  le  domaine  scientifique  pur,  où  les  recherches  sont 
conduites  par  des  savants,  sous  leur  responsabilité  per- 
sonnelle, il  n'y  a  guère  de  place  pour  des  scrupules  de  ce 
genre;  en  cette  matière,  rien  de  ce  qui  ajoute  une- 
parcelle  de  vérité  aux  connaissances  déjà  acquises  ne  peut 
sembler  inutile;  des  savants  consacrent  parfois  toute 
une  vie  à  élucider  l'un  ou  l'autre  point  obscur,  sans 
se  préoccuper  de  l'importance  relative  qu'il  peut  présenter. 
C'est  au  point  de  vue  de  l'absolu,  celui  de  la  science,  qu'ils 
se  placent.  Si  l'on  avait  dû  aborder  les  problèmes  scienti- 
fiques avec  un  esprit  «  pratique  »,  nos-  connaissances  gé- 
nérales —  cela  est  certain  même  du  point  de  vue  des  appli- 
cations —  seraient  autrement  limitées  qu'elles  ne  le  sont 
aujourd'hui.  Mais  la  statistique  est  surtout  utilisée  pour 
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les  fins  de  l'administration;  il  est  rationnel  d'envisager  ses 
recherches  sous  l'aspect  pratique  :  la  relation  entre  la 
peine  et  le  résultat  attendu. 

L'Etat,  principal  organisateur  des  grandes  enquêtes  sta- 
tistiques, peut  reculer  devant  la  dépense  importante  qu'exige 
une  recherche  étendue.  A  plus  forte  raison,  les  sociétés 
savantes,  les  institutions  privées,  les  particuliers,  sont-ils 
en  droit  d'hésiter  à  entreprendre  des  investigations  longues 
et  coûteuses.  Le  prix  de  revient  des  travaux  statistiques  a 
contribué  à  créer  en  faveur  de  l'Etat  une  sorte  de  monopole. 
Cela  est  fâcheux,  parce  que  les  gouvernements  sont  rare- 
ment bien  disposés  en  faveur  des  recherches  scientifiques 
et  qu'ils  ont  grand  besoin  d'être  aiguillonnés  par  la  concur- 
rence. Pour  se  faire  une  idée  du  coût  d'un  travail  statis- 
tique important,  il  convient  de  prendre  pour  exemple  un 
grand  pays,  comme  les  Etats-Unis,  et  d'autre  part  une  vaste 
opération,  un  recensement  général.  Le  tableau  ci-après  ser- 
vira d'illustration  à  cet  égard. 


Personnel  employé  au  recensement  et  coût  du  travail 
aux  États-Unis,  de  1830  à  1900  (*) 


Recense- 

Nombre u'agents 
du  relevé. 

Nombre 
maximum 
d'agents 

Population 

Coût  total. 

Coût 
par  tête. 

S 

ments. 

Recenseurs 

employés 

à  la 
tahulation. 

totale. 

S 

1830 

36 

1,519 

43 

|  11,866,020 

378,545 

0  0294 

1840 

41 

2,167 

28 

17,069,453 

833,370 

0.0488 

1850 

45 

3,231 

160 

23,191.876 

1,423,350 

0  0613 

1860 

64 

4,417 

184 

31,443,321 

1,969,376 

0.0626 

1870 
1880 

75 
150 

j      68  (2) 
f  6,a30 

31,382 

438 
1495 

38,558,371 
50,429,345 

3,421,198 
5,790,678 

0  0877 
0  1148 

1890 

175 

46,804 

3143 

62,979,766 

11,547,127 

0  1833 

1900 

300 

l  2,648  (2) 
i52,871 

3554 

76,149,386 

11,854,817 

0  1550 

(1)  Extrait -de  American  Census  tahmg,  publication  du  Département  du 
Commerce  et  du  Travail,  1903  (a  paru  originairement  dans  The  century  ma- 
gasine, avril  1903). 

(2)  Agents  employés  à  là  campagne,  distincts  des  agents  recenseurs. 


LE    MELEVÉ   STATISTIQUE.  - 


GÉNÉRALITÉS 


103 


Malgré  la  dépense  énorme  que  représente  la  somme  de 
11,854,817  dollars  qui  fut  consacrée  au  recensement  améri- 
cain de  1900,  aucun  employé  ne  fut  payé  pour  son  travail 
au  delà  de  ce  que  gagne  un  ouvrier  intelligent.  Le  fait  peut 
surprendre,  mais  quand  ou  sait  la  somme  incalculable  de 
travail  que  représente  un  vaste  recensement,  on  comprend 
que,  même  avec  un  barême  de  salaires  modestes,  la  dépense 
soit  aussi  grande. 

Il  ne  faut  pas  s'attendre  à  voir  diminuer  le  prix  de  re- 
vient des  opérations  statistiques  :  leur  programme,  de  plus 
en  plus  compliqué,  rendra  nécessaire  pour  son  exécution  le 
concours  de  compétences  mieux  établies  encore  que  par  le 
passé,  et  les  exigences  en  matière  de  rémunération  et  de 
salaires  ne  feront  sans  doute  qu'aller  en  augmentant. 

Les-  limites  du  relevé  n'ont  rien  de  fixe  ou  d'im- 
muable. Plus  rigides  dans  les  pays  arriérés,  elles  seront 
plus  souples  parmi  ceux  avancés  en  civilisation.  Dans  un 
même  pays,  elles  sont  susceptibles  de  reculer  progressive- 
ment à  mesure  que  les  particuliers  verront  s'évanouir  leurs 
défiances,  que  l'organisation  statistique  sera  mieux  com- 
prise, que  l'Etat  attachera  plus  d'importance  aux  re- 
cherches statistique». 

III.  —  Divisions  du  relevé  direct. 

65.  Le  relevé  est  de  deux  espèces  :  le  relevé  statistique 
ou  direct  et  le  relevé  indirect. 

Le  relevé  direct  est  celui  qui  consiste  dans  l'énumération 
de  toutes  les  manifestations  individuelles  du  phénomène 
que  l'on  étudie.  Il  a  pour  type  le  recensement. 

L'étendue  du  relevé  direct  n'est  pas  toujours  aussi  géné- 
rale que  la  définition  donnée  plus  haut  porterait  à  le  croire. 
Des  nécessités  pratiques  conduisent  parfois  à  restreindre  la 
définition  des  unités  que  l'on  compte.  Ainsi  la  statistique 
criminelle  ne  s'étend  qu'aux  crimes  et  délits  dont  les 
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auteurs  ont  été  découverts;  la  statistique  des  accidents  du 
travail  (en  Belgique)  ne  comprend  que  les  accidents  sur- 
venus dans  les  entreprises  assurées  par  les  institutions 
agréées.  En  Angleterre,  la  statistique  des  grèves  ne  relève 
pas  les  conflits  qui  se  sont  produits  dans  des  entreprises 
employant  moins  de  cinq  ouvriers,  etc. 

Certaines  unités  peuvent  donc  être  omises  quand  leur 
importance  est  minime. 

On  se  trouve  encore  dans  le  domaine  du  relevé  direct 
quand  toutes  les  unités  répondant  à  une  définition  générale 
sont  dénombrées.  Bien  qu'un  recensement  industriel  ne  vise 
le  plus  souvent  que  les  entreprises  industrielles  privées,  à 
l'exclusion  de  celles  de  l'Etat,  des  provinces  et  des  com- 
munes, malgré  que  certaines  industries  se  trouvant  aux 
confins  de  l'agriculture  ou  du  commerce  puissent  être  né- 
gligées, un  tel  recensement,  même  limité,  appartient  au 
relevé  direct  parce  qu'il  s'étend  à  toutes  les  entreprises 
industrielles  visées  par  une  définition  générale.  Il  n'en 
serait  pas  de  la  sorte  si  le  nombre  des  industries  à  recenser 
se  trouvait  limité  à  certaines  catégories  ou  groupes;  il 
s'agirait  alors  d'un  relevé  partiel. 

66.  Le  relevé  direct  se  divise  en  : 

a)  Relevé  continu  relatif  à  des  phénomènes  se  pré- 
sentant sans  interruption,  observés  selon  certaines 
divisions  du  temps.  Se  trouvent  dans  ce  cas  les  sta- 
tistiques se  rapportant  au  mouvement  de  la  population 
(naissances,  décès,  mariages,  divorces),  aux  importations  et 
exportations  de  marchandises-,  à  la  criminalité,  au  chômage, 
aux  grèves,  aux  accidents  du  travail,  etc.  Ces  statistiques 
supposent  que  le  relevé  s'exécute  d'une  manière  ininter- 
rompue, d'après  des  règles  fixées  par  une  organisation 
générale  ; 

b)  Relevé  périodique,  qui  vise  certains  phénomènes,  ne  se 
modifiant  que  lentement  et  pouvant  être  observés  de  temps 
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à  autre.  Les  recensements  sont  le  type  de  ce  genre  de 
recherche.  La  population  d 'un  pays  ne  se  modifie  que  lente- 
ment; on  se  contente  donc  de  la  compter  tous  les  cinq  ou 
tous  les  dix  ans.  Le  nombre  d'entreprises  industrielles,  leur 
forme  d'exploitation,  la  répartition  des  entreprises  d'après 
le  nombre  d'ouvriers  qu'elles  occupent,  les  salaires  payés 
aux  ouvriers  et  le  nombre  d'heures  de  travail  exigées  en 
échange  sont  sujets  à  des  modifications  incessantes,  mais 
il  suffit  d'en  observer  les  résultats  à  des  moments  plus  ou 
moins  espacés;  aussi  les  recensements  industriels  ne  se 
font-ils  que  tous  les  dix  ans,  parfois  même  la  périodicité 
du  relevé  n'est  pas  fixe; 

c)  Relevé  occasionnel,  c'est-à-dire  effectué  seulement  lors 
de  certaines  circonstances  exceptionnelles  (maladies  conta- 
gieuses, établissement  des  bases  d'un  impôt,  etc.). 

Il  est  à  remarquer  que  ces  divisions  du  relevé  ne  pré- 
cisent sa  nature  que  pour  autant  qu'elle  est  caractérisée 
par  la  continuité  ou  le  renouvellement  de  l'investigation.  La 
manière  dont  le  relevé  est  accompli  donne  lieu  aux  deux 
divisions  ci-après  : 

67.  Le  relevé  direct  peut  s'exécuter  de  deux  façons  : 

a)  Relevé  automatique  :  c'est  celui  qui  s'effectue  lui- 
même  par  le  libre  jeu  des  institutions  ou  des  coutumes. 

Dans  la  plupart  des  pays,  le  mariage  n'est  reconnu  par 
la  loi  que  s'il  a  été  contracté  devant  un  officier  de  l'état 
civil  chargé  d'en  dresser  acte  sur  le  champ.  D'après  le  Code 
civil,  les  actes  de  naissance  doivent  être  rédigés  de  suite 
après  la  déclaration  de  naissance  qui  doit  être  faite  par  le 
père  dans  les  trois  jours  de  l'accouchement.  Ces  prescrip- 
tions, de  même  que  celles  relatives  aux  décès,  organisent  un 
véritable  relevé  automatique  des  actes  les  plus  importants- 
de  la  vie  civile.  Le  relevé  automatique  présente  le  plus  de 
sécurité  et,  chaque  fois  que  les  statisticiens  peuvent  y  recou- 
rir, ils  ne  manquent  pas  de  le  faire.  Toutefois,  il  faut  s'en- 
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tendre  sur  le  caractère  spécial  de  ce  relevé.  Comme  il  est 
organisé  par  l'autorité  administrative,  ou  qu'il  est  la  suite 
d'une  prescription  législative  quelconque,  il  n'embrasse  pas 
toujours  la  totalité  des  manifestations  individuelles  du  phé- 
nomène visé,  mais  seulement  celles  qui  répondent  à  une  défi- 
nition spéciale.  Les  définitions  juridiques,  notamment,  ne 
correspondent  pas  toujours  à  toute  la  réalité.  'Si  l'on  veut 
substituer  un  point  de  vue  plus  général  à  celui-là,  on  se  trou- 
vera devant  une  difficulté  :  celle  de  compléter  les  données 
déjà  recueillies.  On  recule  le  plus  souvent  devant  cette 
tâche.  Une  précaution  élémentaire  s'impose  alors  :  il  faut 
délimiter  avec  le  plus  grand  soin  le  champ  couvert  par  la 
statistique. 

b)  Le  relevé  est  dit  réfléchi  ou  voulu  quand  il  faut  recher- 
cher spécialement  le&  unités  en  vue  de  les  dénombrer.  Ce 
relevé  exige  beaucoup  de  soin,  tant  pour  éviter  les  répéti- 
tions on  doubles  emplois,  que  pour  prévenir  les  omissions. 


CHAPITRE  II 
Organisation  du  relevé  statistique. 

I.  —  Préparation  du  relevé. 

68.  La  préparation  du  relevé  est  chose  d'importance.  Il 
est  impossible  d'y  apporter  trop  de  soin  et  de  réflexion, 
la  technique,  en  cette  matière,  étant  une  affaire  capitale. 
Trop  de  théoriciens  sont  enclins  à  considérer  ce  problème 
comme  d'une  importance  secondaire,  ou  sont  portés  à 
croire  que  toutes  les  difficultés  se  trouvent  aujourd'hui  réso- 
lues. Il  semble  que  l'attention  des  auteurs  les  plus  récents 
se  port»3  du  côté  de  la  mise  en  œuvre  du  matériel  statistique 
de  préférence  à  ce  qui  regarde  le  relevé.  Nous  serait-il  per- 
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mis  de  trouver  qu'il  y  a  là  une  erreur?  La  technique  du  rele- 
vé n'est  pas  parfaite,  même  après  tant  d'expériences  et  un 
certain  nombre  de  désillusions.  11  n'est  pas  exact  qu'on 
puisse  se  désintéresser  de  tout  ce  qui  la  concerne  comme  si 
l'on  se  trouvait  en  face  d'un  problème  depuis  longtemps 
résolu.  De  nombreux  progrès  sont  à  réaliser  avant  d'arriver 
a  une  solution  satisfaisante.  Le  soin  qu'apportent  les  biolo- 
gistes à  fixer  la  technique  de  leurs  recherches  contient  un 
enseignement  dont  les  statisticiens  doivent  faire  leur  profit. 
Non  seulement  les  principes  généraux  sont  déterminés  avec 
un  soin  extrême  —  un  simple  «  manuel  »  de  technique 
microscopique  est  un  gros  volume  (1),  —  mais,  de  plus,  il 
existe  dans  tous  les  pays  des  périodiques  où  ne  paraissent 
que  des  articles  relatifs  aux  perfectionnements  qui  se  trou- 
vent, de  jour  en  jour,  apportés  aux  méthodes  de  recherche. 
Il  n'y  a  presque  pas  de  mémoire  qui  se  publie  sans  que  l'au- 
teur, non  seulement  expose  et  discute  sa  technique,  mais 
encore  indique  l'une  ou  l'autre  amélioration  qu'il  a  appor- 
tée aux  procédés  usités  avant  lui.  Dans  les  laboratoires,  la 
formation  scientifique  est  tout  d'abord  orientée  vers  la 
technique,  les  précautions  les  plus  minutieuses  sont  réunies 
pour  que  l'observation  se  fasse  dans  des  conditions  irré- 
prochables ;  dans  les  grandes  institutions  scientifiques,  tout, 
jusqu'à  l'atmosphère  de  recueillement  qui  les  enveloppe, 
jusqu'à  leurs  longs  corridors  ouatés  de  silence,  tout  parle  de 
recherches  méticuleuses,  patientes,  orientées  avec  ferveur 
vers  la  découverte  du  vrai. 

Nous  n'en  sommes  pas  là  en  statistique. 

Programmes  mal  établis,  tantôt  trop  étendus,  tantôt  trop 
étroitement  circonscrits  — ■  questions  indiscrètes  ou  à  double 
entente  —  disposition  typographique  défectueuse  des  ques- 
tionnaires utilisés,  agents  recenseurs  mal  choisis,  peu  prépa- 


(1)  Le  Manuel  de  technique  microscopique,  de  M.  E.  de  Rodvii.i.e  (1013), 
ne  comporte  pas  moins  de  720  pages  in-8»,  et  ce  n'est  qu'un  «  court  résumé  » 
des  méthodes  les  plus  usuelles,  avec  renvoi  aux  mémoires  originaux. 
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rés  à  leur  mission,  mal  payés,  —  travail  hâtif  de  mise  en 
œuvre  —  tableaux  d'où  ne.se  dégage  pas  un  rayon  lumineux 
qui  mette  sur  la  piste  d'un  fait  important  le  chercheur  dé- 
couragé: ce  sont  là  défauts  trop  fréquents  et  sur  lesquels, 
maintes  fois,  au  cours  de  cet  exposé,  nous  aurons  à  revenir. 
A  côté  d 'œuvres  habilement  agencées,  il  n'en  est  que  trop 
laissant  à  désirer.  Depuis  quelques  années,  les  aperçus  tech- 
niques se  font  plus  fréquents  et  les  grandes  administra- 
tions montrent  moins  de  discrétion  dans  l'exposé  des  mé- 
thodes à  l'aide  desquelles  les  données  statistiques  ont  été 
recueillies  et  mises  en  œuvre.  Dans-  un  travail  scientifique, 
rien  ne  vaut  la  sincérité  ;  une  erreur,  franchement  reconnue, 
est  presque  aussi  profitable  à  la  science  qu'une  vérité  dé- 
montrée. Les  améliorations  constatées  sont  dues,  en  partie, 
à  l'action  de  l'Institut  international  de  statistique,  à  qui  on 
ne  saurait  en  être  trop  reconnaissant.  C  'est  par  la  critique 
comparée  des  méthodes  que  la  statistique  se  perfectionnera, 
comme  se  sont  perfectionnées  les  sciences  naturelles  par 
l'usage  d'une  technique  de  plus  en  plus  sûre,  mise  au  ser- 
vice de  l 'hypothèse  scientifique. 

69.  Comme  dans  tout  travail,  il  faut,  avant  d'entamer 
une  recherche  statistique,  avoir  un  plan,  se  tracer  un  pro- 
gramme logiquement  ordonné.  Les  qualités  requises  pour 
ce  programme  ne  sont  pas  différentes  de  celles  recomman- 
dées dans  tout  plan  quelconque,  mais  elles  s'étendent  à 
quelques  matières  qu'on  n'est  pas  dans  l'habitude  de  consi- 
dérer dans  les  études  économiques  ou  sociales  ordinaires; 
c'est  la  raison  pour  laquelle  cette  question  si  simple  de  l'éla- 
boration du  plan  ou  programme  demande  à  être  examinée 
avec  quelque  détail. 

Nous  remarquons,  en  premier  lieu,  que  l'élaboration  du 
programme  se  fera  dans  des  conditions  très  différentes, 
selon  que  l'on  aura  à  organiser  un  relevé  fait  d'après  des 
documents  recueillis  en  vertu  de  prescriptions  spéciales 


ORGANISATION  DU  liELEVÉ  STATISTIQUE 


109 


(relevé  automatique)  ou  un  relevé  de  personnes  ou  de  faits 
n'ayant  encore  été  l'objet  d'aucune  observation  (relevé 
réfléchi). 

Dans  le  premier  cas,  l'auteur  du  programme  se  trouve 
nécessairement  devant  un  champ  de  recherches  limité  ;  il  ne 
peut  songer  à  faire  porter  des  investigations  sur  un  nombre 
de  faits  supérieur  à  ceux  consignés  dans  les  documents  à 
utiliser;  il  lui  est  impossible  aussi  d'en  modifier  la  nature, 
et  si  ces  faits  sont  amassés  d'après  un  critère  juridique, 
la  recherche  statistique  se  trouve  limitée  aux  faits  répon- 
dant à  la  définition  juridique,  sans  plus. 

La  statistique  des  accidents  du  travail,  par  exemple,  n'est 
pas  le  relevé  de  tous  les  accidents  survenus  au  cours  du 
travail,  mais  seulement  de  ceux  qui  répondent  à  la  notion 
juridique  d'accident  de  travail  et  se  sont  produits  dans  des 
entreprises  soumises  à  la  loi. 

Si  l'auteur  du  programme  est  chargé  d'organiser  lui- 
même  la  recherche,  il  jouit  évidemment  d'une  plus  grande 
liberté,  sauf  ce  qui  est  dit  plus  haut  relativement  aux  li- 
mites de  la  statistique. 

Un  plan  ou  programme  bien  ordonné  comprendra  la  dé- 
termination précise  de  l'objet  du  relevé,  l'étude  du  coût  de 
l'opération,  un  essai  de  présentation  des  données  et,  dans 
les  cas  compliqués  et  nouveaux,  des  dispositions  pour  pro- 
céder à  un  essai  de  dénombrement.  De  plus,  il  fixera 
l'époque  du  relevé  et  les  délais  prévus  pour  son  achève- 
ment, l'unité  géographique  à  laquelle  les  faits  sont  rap- 
portés, les  voies  et  moyens  d'exécution,  les  causes  d'erreur 
et  les  moyens  de  les  faire  disparaître. 

Cette  suite  complexe  de  recherches  comporte  une  prévi- 
sion à  longue  portée.  Celui  qui  organise  un  travail  statis- 
tique ne  peut  se  contenter  de  vivre  au  jour  le  jour  et  de 
parer  aux  difficultés  au  fur  et  à  mesure  qu'elles  se  présen- 
tent. Il  lui  faut  des  vues  larges  et  précises  sur  toutes  les 
opérations  qui  se  dérouleront  successivement,  sinon  à  tout 
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instant  il  se  trouvera  devant  le  fait  accompli  sans  possi- 
bilité de  revenir  sur  ses  pas  lorsqu'une  erreur  lui  appa- 
raîtra. On  ne  recommence  pas  un  relevé  ;  on  ne  refait  pas 
même  un  dépouillement  lorsqu'il  s'agit  d'un  travail  por- 
tant sur  quelques  centaines  de  milliers  ou  quelques  mil- 
lions d'unités.  La  sûreté  de  vues  ici  n'est  pas  seulement  une 
qualité  désirable,  c'est  une  exigence  à  laquelle  nul  ne  peut 
se  soustraire. 

70.  Ajoutons  encore,  ce  qui  est  essentiel,  que  la  rédaction 
du  programme  exige  souvent  chez  l'auteur  du  document 
l'existence  d'une  hypothèse  scientifique  à  vérifier.  Sans 
doute,  beaucoup  de  recherches  statistiques  se  font  aujour- 
d'hui sur  des  bases  consacrées  par  l'usage  et  par  la  science. 
Il  est  difficile  d'innover  en  matière  de  statistique  de  la 
population,  bien  que,  même  dans  ce  domaine  depuis  si  long- 
temps exploré,  des  points  de  vue  nouveaux  surgissent 
encore  de  temps  à  autre.  Mais  qui  ne  voit  le  rôle  essentiel 
de  l'hypothèse  scientifique  dans  les  questions  où  intervien- 
nent les  facteurs  psychologiques,  moraux,  économiques? 
Que  sera  la  statistique  criminelle  si  elle  n'est  guidée  par 
l'hypothèse  scientifique!  Un  amas  confus  de  faits  contradic- 
toires sur  lesquels  le  chercheur  sera  impuissant  à  projeter 
la  moindre  clarté.  La  statistique  industrielle,  celle  des 
salaires  et  des  heures  de  travail,  celle  des  grèves,  pour  citer 
quelques  exemples,  ne  peuvent  donner  de  résultats  vraiment 
intéressants  que  si  les  recherches,  au  moment  de  l'élabora- 
tion du  programme,  sont  orientées  en  tenant  compte  des 
théories  économiques. 

Qu'on  ne  confonde  pas  l'usage  de  Phypothèse  scientifique 
avec  le  parti  pris  ou  la  partialité  :  en  partant  d'une  théorie, 
le  savant  ne  la  considère  que  comme  une  assertion  soumise 
à  la  vérification;  c'est  une  orientation  donnée  aux  recher- 
ches, rien  de  plus,  et  les  faits  seront  par  lui  recueillis  avec 
autant  de  soin,  acceptés  avec  autant  de  respect  s'ils  détrui- 
sent la  thèse  que  s'ils  la  confirment. 
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L'usage  de  l'hypothèse  scientifique  imprime  au  pro- 
gramme et  à  ses  divisions  une  qualité  maîtresse  :  la  clarté. 
Tout  se  trouvant  ordonné  selon  une  idée  directrice,  les 
différentes  parties  se  trouvent  facilement  disposées  dans 
leur  ordre  logique,  les  questions  deviennent  précises,  elles 
se  complètent  l'une  l'autre,  les  détails  dans  lesquels  on 
entre  ne  sont  pas  oiseux,  il  n'y  a  pas  de  demandes  inutiles. 

71.  Avant  tout,  il  importe  de  préciser  les  caractères  de 
la  chose  que  l'on  compte  :  l'unité.  Celle-ci  forme  la  base  de 
la  recherche  statistique;  on  en  compte  le  nombre  d'abord; 
on  en  relève  ensuite  les  qualités.  Dans  un  recensement  de 
la  population,  l'unité  est  l'individu;  celui-ci  peut  être  con- 
sidéré à  deux  points  de  vue  :  l 'individu  présent,  au  moment 
du  recensement,  dans  un  lieu  donné;  l'individu  qui  a  sa 
résidence  habituelle  dans  un  lieu  donné,  mais  qui  peut  en 
être  momentanément  absent.  Le  premier  point  de  vue 
donne  la  population  de  fait;  le  second  permet  de  déter- 
miner la  population  de  droit.  On  peut  adopter  l'un  ou 
l'autre,  ou,  ce  qui  est  plus  fréquent,  tous  les  deux  à  la  fois. 
Lorsque  cette  question  est  décidée  vient  la  définition  des 
qualités  de  l'individu  :  il  peut  être  un  homme  ou  une 
femme  (répartition  par  sexe),  jeune  ou  âgé  (répartition  par 
âge),  marié  ou  non  (répartition  par  état  civil),  exerçant  une 
profession  ou  n'en  exerçant  aucune  (répartition  par  profes- 
sion ou  condition),  habiter  la  ville  ou  la  campagne  (répar- 
tition géographique). 

Dans  toutes  ces  hypothèses,  l'unité  reste  la  même,  c'est 
elle  qui  donne  à  la  statistique  sa  physionomie  propre. 

La  statistique  criminelle  emploie  une  double  unité:  l'in- 
fraction ou  le  délit  et  le  délinquant.  La  statistique  de  l'in- 
dustrie et  du  commerce  d'abord  a  pour  unité  l'entreprise 
industrielle  ou  commerciale;  elle  compte  les  entreprises, 
puis  elle  analyse  leur  caractère  :  l'industrie  à  laquelle  elles 
appartiennent,  leur  état  d'activité  ou  de  chômage,  leur 
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situation  géographique,  leur  importance,  le  mode  d'exploi- 
tation duquel  elles  relèvent,  leur  grandeur,  etc.  On  peut 
dire  aussi  que  la  statistique  industrielle  a  une  seconde 
unité  :  l'individu  occupé  dans  l'entreprise  industrielle. 
Après  le  comptage  de  ces  unités,  vient  l'étude  des  particu- 
larités- qu'elles  présentent  :  le  sexe,  l'âge,  la  situation  so- 
ciale, le  salaire,  les  heures  de  travail,  la  résidence  dans  une 
localité  autre  que  celle  où  l 'individu  trouve  son  occupation. 

72.  Pour  pouvoir  former  la  base  de  la  statistique,  l'unité 
doit  réunir  certaines  qualités;  on  peut  les  résumer  de  la 
sorte  : 

1°  Elle  doit  appartenir  à  l'ordre  des  phénomènes  col- 
lectifs, sinon  il  existe  des  procédés  plus  rapides  et  moins 
coûteux  que  la  méthode  statistique  pour  en  déterminer  la 
nature  et  les  caractères; 

2°  Elle  doit  être  susceptible  de  se  réduire  en  une  expres- 
sion numérique.  Il  faut  donc  que  les  objets  qui  constituent 
les  unités  se  présentent  par  unité  individuelle  :  une  maison, 
un  ménage,  une  famille.  C'est  pour  cela  qu'on  dit  que  le 
relevé  est  l'observation  des  manifestations  individuelles 
d'un  phénomène.  Si  les  faits  se  présentaient  en  masse  con- 
fuse, on  ne  saurait  compter  les  unités  dont  ils  se  composent, 
donc,  on  ne  pourrait  en  faire  la  statistique. 

C  'est  une  erreur  de  vouloir  comprendre  dans  des  statis- 
tiques des  choses  qui  ne  se  différencient  que  par  leurs 
qualités  (bon,  mauvais,  grand,  petit,  etc.),  car  ceci  est 
affaire  d'appréciation  subjective.  Dans  certaines  recher- 
ches, on  substitue  des  chiffres  aux  mots  qui  expriment  des 
qualités  :  ainsi,  à  une  récolte  qu'on  espère  devoir  être  très 
bonne,  on  attribuera  la  cote  75,  à  une  bonne  la  cote  50,  à 
une  mauvaise  la  cote  25.  Les  chiffres  ne  changent  rien  à 
l'affaire,  il  s'agit  toujours  d'une  appréciation.  Le  procédé 
dont  il  s'agit  n'est  d'ailleurs  employé  que  dans  l'estimation 
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de  la  récolte  espérée  et  nous  verrons  plus  loin  que  les  esti- 
mations dépendent  du  relevé  indirect. 

3°  Elle  sera  de  nature  à  pouvoir  être  reconnue  d'une 
façon  qui  exclut  tout  doute.  Nous  reviendrons  sur  ce  point 
très  important  à  l'endroit  où  nous  parlerons  de  la  rédaction 
du  questionnaire.  Pour  que  l'unité  soit  telle  qu'elle  se  dis- 
tingue facilement  de  toutes  les  autres,  il  n'est  pas  néces- 
saire que  sa  nature  soit  différente  des  autres  choses;  ce 
serait  limiter,  d'une  façon  arbitraire,  le  domaine  de  la 
statistique;  il  suffit  qu'une  bonne  définition  en  soit  donnée. 
La  définition  peut  être  vulgaire  —  comme  celle  donnée  par 
le  dictionnaire  —  ou  juridique,  ou  économique  ;  parfois,  les 
notions  fournies  par  ces  définitions  sont  encore  trop  peu 
précises  par  rapport  au  but  visé  et  l'on  doit  s'arrêter  à  une 
définition  statistique  spéciale. 

73.  La  définition  vulgaire  prête  à  de  nombreux  malenten- 
dus ;  souvent,  elle  définit  les  mots  par  les  mots  et  n'apprend 
rien  de  précis.  M.  Bertillon  a  donné  un  exemple  typique 
des  divergences  auxquelles  on  arrive  en  empruntant,  sans 
modification,  des  définitions  à  la  langue  vulgaire  :  ayant 
à  dresser  simultanément  un  relevé  des  maisons  de  -Paris, 
l'administration  municipale  et  le  ministère  des  finances 
arrivèrent  à  des  résultats  fortement  discordants.  Comment 
est-il  possible  de  se  tromper  aussi  grossièrement  dans  le 
comptage  des  maisons?  se  demandèrent  les  sceptiques.  La 
cause  de  la  divergence  était  simple  :  l'administration  muni- 
cipale avait  compté  les  habitations,  le  fisc  les  locaux  im- 
posables. Les  deux  statistiques  poursuivant  des  buts 
distincts,  il  n'y  avait  pas,  dans  ce  cas,  d'erreur  à  propre- 
ment parler,  mais  l'emploi  du  terme  «  maison  »  prête  à 
confusion  et  une  erreur  de  ce  genre  aurait  pu  être  com- 
mise dans  toute  statistique  qui  se  serait  bornée  à  employer 
ce  mot  sans  l'accompagner  de  commentaires. 

On  a  confondu  maintes  fois,  sous  l'expression  de  mort- 
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nés,  les  enfants  sans  vie  et  les  enfants  non  viables  décédés- 
avant  la  fin  du  troisième  jour  qui  suit  leur  naissance.  Dans 
quelques  pays,  la  distinction  était  établie,  ailleurs  elle  ne 
l'était  pas  et  ce  défaut  de  concordance  fut  longtemps  une 
cause  de  trouble  dans  la  comparaison  des  statistiques. 

Les  définitions  juridiques  sont,  en  général,  plus  précises 
que  la  définition  vulgaire.  Quelquefois,  cette  précision  est 
un  défaut,  en  ce  sens  que  la  définition  légale  vise  un  cas 
particulier,  est  rédigée  dans  un  but  spécial,  ce  qui  en 
exclut  des  cas  tout  aussi  intéressants  que  la  statistique  a 
intérêt  à  connaître.  Aux  termes  de  la  loi  italienne,  du  31  jan- 
vier 1901  sur  l'émigration,  loi  qui  a  pour  but  de  prendre 
des  mesures  de  protection  en  faveur  des  émigrants, 
«  doivent  être  considérés  comme  émigrants  tous  ceux  qui, 
voyageant  par  mer  en  troisième  classe,  se  dirigent  vers 
des  pays  situés  au  delà  du  détroit  de  Gibraltar  ou,  s'ils 
sont  au  nombre  de  plus  de  cinquante,  vers  des  pays  au 
delà  du  canal  de  Suez  ».  Cette  définition,  très  spéciale,  ne 
peut  aucunement  servir  à  la  statistique  de  l'émigration  : 
celle-ci  n'a  pas  à  se  baser  sur  le  mode  de  transport,  ni  sur 
la  classe  du  billet  du  voyageur. 

La  statistique  du  chômage  fournit  un  exemple  d'une 
définition  économique.  Chômage  s'oppose  à  activité;  dans 
un  sens  large,  un  chômeur  est  quelqu'un  qui  ne  travaille 
pas.  Mais  faudrait-il  compter  parmi  les  chômeurs  les  per- 
sonnes sans  profession1?  Ce  serait  absurde.  Faut-il  con- 
sidérer comme  chômeurs  les  malades,  les  invalides,  les 
infirmes,  les  vieillards?  La  chose  est  très  contestable.  Si 
l'on  met  en  rapport  le  nombre  de  chômeurs  et  l'activité 
industrielle,  il  vaut  mieux,  semble-t-il,  définir  comme  chô- 
meur l 'ouvrier  qui,  en  état  de  travailler  et  désirant  travail- 
ler, est  sans  ouvrage.  Une  définition  de  ce  genre  est 
essentiellement  propre  à  la  science  économique. 

Les  définitions  purement  statistiques  sont  fort  nom- 
breuses. En  voici  une  qui  est  adoptée  par  la  statistique 
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internationale  :  c'est  la  définition  de  l'unité  ouvrière  en 
matière  de  statistique  des  accidents  du  travail.  Pour  déter- 
miner la  fréquence  des  accidents,  il  faut  pouvoir  apprécier 
d'une  manière  aussi  exacte  que  possible  le  nombre  des 
ouvriers  soumis  au  risque.  Or,  le  nombre  des  ouvriers 
occupés  dans  un  établissement  industriel  varie  souvent  au 
cours  de  l'année.  Devant  la  difficulté,  voire  l'impossibilité 
d'obtenir  à  cet  égard  des  données  exactes,  les  Congrès 
internationaux  ont  préconisé  d'adopter  une  mesure  com- 
mune. Le  nombre  de  journées  de  travail  effectuées  par 
l'ensemble  du  personnel  ouvrier  peut  toujours  être  connu 
avec  exactitude  et  ce  nombre  de  journées  représente  les 
journées  effectives  de  travail,  y  compris  les  fractions  de 
((  journées  »  prestées  par  le  personnel  au  delà  de  la  durée 
normale  du  travail.  Dès  lors,  si  l'on  adopte  comme  divi- 
seur de  ce  nombre  un  cbiffre  représentant  la  quantité 
de  jours  d'exploitation,  on  peut  arriver  à  une  certaine 
grandeur  idéale  qui  exprime  le  nombre  de  travailleurs  com- 
plets, c'est-à-dire  de  travailleurs  ayant  tous  été  occupés 
pendant  le  même  temps.  L'Autriche  et  l'Allemagne  ont  les 
premières  adopté  le  nombre  de  300  jours  d'exploitation  et 
ont  donné  le  nom  de  Vollarbeiter  au  quotient  de  la  division 
des  journées  effectives  par  le  chiffre  300.  La  même  unité 
a  été  adoptée  par  la  statistique  belge  des  accidents  du  tra- 
vail (1). 

11.  —  Le  relevé  considéré  sous  le  point  de  vue  du  temps. 

74.  Tous  les  phénomènes  quelconques  peuvent  être  con- 
sidérés sous  l'aspect  du  temps  et  de  l'espace.  Essayons 
d'indiquer  de  quelle  manière  ces  notions  générales  con- 
ditionnent et  limitent  le  relevé  et  les  phénomènes  auxquels 
il  s'applique. 


(1)  Royaume  de  Belgique.  Office  du  travail.  Statistique  des  accidents  du 
travail,  t.  II,  p.  570.  Bruxelles,  1012. 
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Sous  le  rapport  du  temps,  le  relevé  peut  être  considéré 
sous  trois  aspects  : 

1°  quant  à  la  durée  de  l'observation; 
2°  quant  à  l'époque  de  l'observation; 
3°  quant  à  la  durée  du  phénomène. 

En  ce  qui  regarde  la  durée  de  l'observation,  il  faut  dis- 
tinguer entre  le  relevé  qui  vise  à  reproduire  l'état  d'un 
phénomène,  de  celui  qui  cherche  à  en  faire  connaître  le 
mouvement.  Dans  le  premier  cas,  on  essaye  de  reproduire 
les  faits  dans  des  conditions  telles  qu'ils  échappent  aux 
accidents  de  variabilité.  Dans  le  second,  on  s'efforce  au 
contraire  de  faire  apparaître  les  conditions  diverses  in- 
fluençant le  phénomène,  de  façon  à  connaître  les  causes 
générales  et  les  causes  accidentelles.  En  démographie,  un 
recensement  de  la  population  forme  un  type  de  statistique 
du  premier  genre  ;  le  relevé  des  naissances,  des  décès,  des 
mariages,  appartient  à  la  seconde  catégorie,  dont  l'objet 
est  le  mouvement  de  la  population. 

Examinons  d'abord  les  faits  dans  leurs  rapports  avec  la 
durée  du  relevé. 

Le  synchronisme  des  opérations  du  relevé  est,  dans  ce 
cas,  une  condition  essentielle.  Le  fait  à  .enregistrer  est-il 
simple,  n'y  a-t-il  que  peu  d'unités  à  relever,  les  difficultés 
à  vaincre  sont  de  minime  importance  et  il  n'y  a  pas  lieu  de 
s'y  arrêter  ici.  Au  contraire,  lorsque  le  fait  est  complexe, 
lorsqu'il  se  compose  d'une  multitude  de  manifestations 
individuelles,  le  statisticien  doit  prendre  des  précautions 
minutieuses  afin  d'éviter  de  mêler  les  faits  d'hier  aux  faits 
d'aujourd'hui.  Il  n'y  aurait  aucune  précision  dans  un 
relevé  confondant  dans  un  ensemble  hétérogène,  les  faits 
passés  avec  les  faits  actuels.  Pendant  l'enregistrement  de 
certains  faits,  ceux-là  déjà  compris  dans  le  relevé  auraient 
changé  d'aspect.  On  sent  trop  bien  que  le  relevé  de  Vétat 
d'un  phénomène  doit  être  synchronique  pour  devoir  s'at- 
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tarder  à  démontrer  la  nécessité  de  la  simultanéité  de  toutes 
ses  parties  :  ce  serait  faire  la  démonstration  de  l'évidence 
même.  A  un  point  de  vue  idéal,  une  statistique  de  ((  situa- 
tion »  devrait  être  une  photographie  instantanée.  En 
pratique,  on  se  trouve  encore  fort  éloigné  de  la  perfection. 
Celle-ci  est  d'ailleurs  hors  de  notre  portée  :  admettons  la 
possibilité  de  recenser  la  population  en  quelques  heures; 
pendant  ce  temps  peuvent  survenir  des  décès  et  des  nais- 
sances non  consignés  sur  les  bulletins. 

Notre  ambition  se  limite  donc  à  raccourcir,  par  une  bonne 
organisation  administrative,  le  délai  exigé  pour  les  ré- 
ponses à  donner,  et  à  veiller  avec  une  attention  scrupuleuse 
au  synchronisme  de  toutes  les  parties  du  relevé  (1). 

75.  Alors  que  dans  les  observations  relatives  à  1'  «  état  » 
d'un  phénomène  on  s'efforce  de  rendre  aussi  brève  que  pos- 
sible la  durée  du  relevé,  on  tend,  au  contraire,  à  la  pro- 
longer autant  qu'on  le  peut  quand  il  s'agit  de  faire  appa- 


(1)  Les  mesures  prises  pour  atteindre  ce  but  sont  parfois  d'une  grande 
ingéniosité.  Celles  qui  ont  été  mises  en  vigueur  par  le  gouvernement  britan- 
nique aux  Indes  pour  le  recensement  de  la  péninsule  méritent  qu'on  s'y 
arrête,  car  elles  sont  réellement  instructives.  Le  dernier  recensement  de  l'Inde, 
qui  date  du  30  mars  1911,  a  été,  comme  les  dénombrements  précédents, 
accompli  en  une  seule  nuit,  avec  le  concours  de  plus  de  deux  millions  de  recen- 
seurs. Tout  le  territoire  de  l'Inde  se  trouve  divisé  en  «  blocs  »,  comprenant 
chacun  de  trente  à  cinquante  habitations  ;  au-dessus  vient  le  «  cercle  »,  com- 
prenant de  dix  à  cinquante  «  blocs  ».  Les  «  cercles  »  sont  réunis  d'après  les  divi- 
sions administratives  (talisils,  taluks,  etc.).  Enfin,  la  centralisation  suprême 
est  confiée  à  un  commissaire  spécial  pour  le  recensement  de  l'Inde.  Quelques 
semaines  avant  la  date  fixée  pour  le  recensement,  les  agents  recenseurs  font 
le  tour  des  habitations  qui  leur  sont  désignées  et  consignent  sur  le  bulletin  les 
réponses  concernant  toutes  les  personnes  qui  ont  à  cet  endroit  leur  résidence 
habituelle.  Lorsque  la  nuit  du  recensement  est  arrivée,  les  agents  se  présen- 
tent à  nouveau,  biffent  les  indications  du  bulletin  relatives  aux  personnes  non 
présentes  et  portent  sur  ce  document  les  réponses  concernant  les  nouveaux 
venus.  Cette  mission,  confiée  à  des  agents  indigènes,  est,  à  ce  qu'on  assure, 
remplie  avec  un  soin  extrême,  au  point  que  les  réponses  libellées  par  les 
Européens  sont  inférieures,  comme  précision,  à  celles  formulées  par  les  agents 
hindous.  Le  synchronisme  est  donc  réalisé  d'une  façon  très  satisfaisante  dans 
l'ensemble;  il  y  a,  naturellement,  des  exceptions  motivées  par  des  maladies 
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raître  le  «  mouvement  »  des  faits  étudiés.  La  théorie  pure 
élèverait  ici  une  prétention  aussi  irréalisable  que  celle  qui 
consiste  à  faire  du  relevé  une  photographie  instantanée: 
ce  serait  de  réunir  des  observations  portant  sur  le  temps 
entier  pendant  lequel  le  phénomène  a  continué  à  se  mani- 
fester. Autant  assigner  à  la  statistique  une  durée  qui  se 
confondrait  avec  celle  de  la  vie  de  l'humanité.  Sans  nous 
arrêter  à  des  rêves  de  cette  nature,  reconnaissons  l'évi- 
dence; l'aspect  toujours  changeant  des  faits  observés  par 
la  statistique  exige  une  longue  période  de  temps  couverte 
par  l'observation,  pour  que  l'on  ait  chance  de  découvrir  les 
lois  permanentes  qui  gouvernent  les  faits  de  la  nature.  C  'est 
seulement  lorsque  les  faits  amassés  sont  assez  nombreux, 
que  nous  nous  trouvons  dans  les  conditions  voulues  pour 
observer  leur  régularité;  or,  leur  répétition  étant  limitée 
dans  le  cours  d'une  année,  par  exemple,  il  faut,  pour  réunir 
des  cas  assez  nombreux,  que  le  relevé  couvre  une  série  d'an- 
nées. Les  changements  d'une  année  à  l'autre  peuvent  être 
dus  à  des  causes  accidentelles;  c'est  seulement  à  condition 
d'étendre  la  période  d'observation  qu'on  verra  se  dégager 
les  tendances  plus  profondes  au-dessus  des  variations  de 
courte  durée.  La  statistique  morale  a  surtout  besoin  de  cette 
observation  prolongée,  qui,  pour  être  réalisée  dans  des  con- 


contagieuses,  des  troubles,  des  événements  imprévus,  etc.  Des  difficultés, 
propres  à  la  péninsule,  sont  celles  résultant  de  la  présence  dans  les  trains  ou 
dans  les  steamers  de  voyageurs  pendant  un  parcours  qui  exige  souvent  plus  eurs 
jours,  du  travail  de  bûcherons  qui  s'enfoncent  dans  les  forêts  et  y  séjournent 
plusieurs  semaines,  de  l'existence  de  nombreux  endroits  consacrés  où  se 
rendent  des  milliers  de  pèlerins.  Pour  recenser  les  voyageurs,  on  a  imaginé 
les  dispositions  suivantes  :  toute  personne  qui  prend  le  train  après  7  heures 
du  soir  la  nuit  du  recensement,  est  recensée  sur  le  quai  d'embarquement,  si  on 
en  a  le  temps,  sinon  dans  le  train  même.  Les  voyageurs  qui  montent  dans  le 
train  au  cours  de  la  nuit  sont  recensés  de  même,  à  moins  qu'ils  n'exhibent  un 
certificat  établissant  qu'ils  ont  déjà  été  recensés.  Vers  (i  heures  du  matin, 
tous  les  trains  s'arrêtent  et  on  procède  à  la  visite  des  wagons  pour  s'assurer 
si  personne  n'a  été  omis  du  recensement  (*).  La  population  de  l'Inde  était, 
le  30  mars  1011,  de  315,156,396  habitants. 

(*)  Census  of  Indîa  1911,  vol.  I.  Report  by  E.  A.  Gait,  Introduction.  Cal- 
cutta, 1913. 
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ditions  convenables,  exige  le  relevé  automatique  ou  continu. 

Il  ne  faut  pas  confondre  la  durée  des  observations  avec 
l'unité  de  temps  utilisée  pour  la  présentation.  La  statistique 
des  décès  est  organisée  de  telle  façon  qu'on  puisse  la  présen- 
ter d'une  manière  très  détaillée  quant  au  temps  où  les  décès 
sont  enregistrés  ;  parce  que  cette  statistique  demande  à  être 
suivie  pendant  longtemps  pour  pouvoir  déterminer  les  coef- 
ficients de  mortalité,  suit-il  de  là  qu'on  puisse  se  borner  à 
relever  et  à  publier  les  décès  à  de  longs  intervalles,  par 
exemple  pour  une  année  entière?  Il  n'y  a  aucun  rapport 
entre  les  deux  ordres  d'idées.  Les  observations  les  plus- 
longues  peuvent  gagner  beaucoup  à  être  présentées  à  inter- 
valles fort  rapprochés  ;  il  en  est  ainsi  des  naissances  et  des 
décès  pour  lesquels  on  remarque  de  grandes  variations  par 
mois,  et  même  par  jour  et  par  heure.  Les  statistiques  météo- 
rologiques seraient  dénuées  d'intérêt  si  on  se  bornait  à  en 
publier  les  résultats  par  mois;  il  faut  descendre,  au  con- 
traire, dans  le  détail  pour  en  tirer  les  enseignements 
qu'elles  comportent.  A  cet  égard,  les  appareils  enregis- 
treurs rendent  les  plus  grands  services  à  l'aide  des  gra- 
phiques qu'ils  tracent  automatiquement. 

76.  Le  relevé  doit  donc  satisfaire  à  deux  conditions  :  être 
le  plus  prolongé  possible,  être  le  plus  particularisé  qu'il  se 
peut.  Ces  conditions  ne  sont  pas  contradictoires,  mais  com- 
plémentaires. Dans  le  cas  du  relevé  continu  comme  du  relevé 
périodique,  l'observation  isolée  sera  soustraite  aux  modifi- 
cations successives  des  événements;  elle  sera  rapide  et,  si 
c'est  nécessaire,  répétée.  Mais  dans  les  statistiques  du 
«  mouvement  »  social,  le  temps  sur  lequel  portera  l'observa- 
tion sera  aussi  long  qu'on  le  pourra.  Au  point  de  vue  de  la 
durée,  on  ne  peut  mieux  comparer  les  statistiques  d'état  et 
de  mouvement  qu'à  la  photographie  instantanée  et  à  la  ciné- 
matographie.  Un  film  est  une  succession  ininterrompue  de 
photographies,  prises  très  rapidement;  si  l'on  pouvait  re- 
lever les  phénomènes  de  la  vie  sociale  avec  une  égale  pré- 
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cision,  on  posséderait  des  statistiques  parfaites.  Le  procédé, 
malheureusement,  ne  s'applique  pas  à  tous  les  faits  qu'il 
serait  intéressant  de  connaître.  Il  faut  alors  se  borner  à 
prendre,  à  un  moment  opportun,  une  photographie  instan- 
tanée des  phénomènes,  avec  les  précautions  voulues  pour 
assurer  un  synchronisme  parfait. 

Quels  sont  les  phénomènes  à  observer  par  le  moyen  du 
relevé  continu?  Quels  sont  ceux  auxquels  convient  le  relevé 
périodique  ou  occasionnel?  La  réponse  se  trouve  déjà 
donnée  dans  la  définition  des  modalités  du  relevé, 
nous  y  revenons  sommairement  en  conclusion  de  ce 
qui  précède.  Parmi  les  faits  soumis  au  relevé  statistique, 
il  en  est  dont  l'évolution  relativement  lente  exige  seulement 
un  certain  nombre  de  points  de  repère  suffisamment 
espacés;  entre  ces  points,  on  pourrait  noter  des  change- 
ments, mais  ils  sont  peu  importants  dans  l'ensemble.  Un 
voyageur  qui  circule  sur  une  route  compte  les  bornes  kilo- 
métriques, placées  bien  en  évidence  le  long  du  chemin  ; 
il  ne  cherche  pas  du  regard  les  petites  bornes  hectomé- 
triques  à  moitié  dissimulées  sous  l'herbe  des  talus  et  des 
fossés-. 

La  population  d'un  pays  se  modifie  constamment;  le 
changement,  par  rapport  à  la  masse,  en  une  semaine,  un 
mois,  une  année  a-t-il  une  réelle  importance?  Entrées  et 
sorties  se  compensent,  ce  n'est  qu'après  un  intervalle  assez 
long  que  les  diminutions  ou  les  augmentations  successives 
parviennent  à  apporter  au  total  un  changement  assez 
sensible  pour  être  noté.  Ce  qui  est  vrai  du  nombre  des 
habitants,  l'est  encore  bien  davantage  du  rapport  des  sexes, 
de  la  répartition  des  âge&,  de  la  population  des  villes 
et  des  campagnes,  de  l'importance  relative  des  professions 
industrielles  et  agricoles,  de  la  proportion  des  personnes 
actives  et  des  personnes  sans  profession.  Il  est  bien  suffi- 
sant de  vérifier  tous  les  dix  ans  si  les  faits  relevés  lors  du 
précédent  recensement  sont  restés  les  mêmes  ou  non. 
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Même  lorsqu'une  période  est  caractérisée  par  un  mouve- 
ment économique  intense,  les  salaires,  dans  l'ensemble,  ne 
haussent  pas  assez  vite  pour  qu'il  soit  nécessaire  d'opérer 
des  relevés  périodiques  à  court  intervalle  ;  on  peut  en  dire 
autant  des  heures  de  travail.  En  Belgique,  bien  que  les 
années  1896  à  1901  aient  été  marquées  d'une  grande  acti- 
vité, la  statistique  des  salaires  dans  les  industries  textiles, 
dressée  au  mois  d'octobre  1901,  n'a  montré  que  peu  de  chan- 
gements avec  celle  faite  le  même  mois  en  1896  :  dans  l'en- 
semble des  industries  textiles,  les  salaires  n'ont  guère  varié 
ni  pour  les  hommes,  ni  pour  les  femmes,  ni  pour 
les  enfants  ;  pour  les  salaires  des  hommes  et  ceux 
des  femmes,  il  y  a  lieu  de  noter  un  léger  mouvement 
d'ascension  des  taux  les  plus  bas  vers  les  taux  plus  éle- 
vés, toutefois  ce  mouvement  n'atteint  pas,  pour  les  hommes, 
un  pour  cent  du  nombre  des  ouvriers  gagnant  le  même  taux 
de  salaire  en  1896  (1). 

Il  nous  suffit  de  connaître  la  distribution  des  salaires  ou 
le  chiffre  de  la  population  un  jour  donné,  étant  donnée  la 
fixité  relative  de  ces  données  pendant  une  période  assez 
longue.  Mais  pourrions-nous  nous  déclarer  satisfaits  de 
savoir  le  nombre  des  décès  et  des  naissances,  les  causes  de 
décès  un  seul  jour  de  l'année?  Il  est  évident  que  non.  Nous 
sommes  là  en  présence  de  faits  dont  l'équilibre  ne  s'établit 
que  lentement,  le  relevé  doit  être  continu  pour  pouvoir 
grouper  des  données  utilisables. 

La  base  de  la  distinction  à  établir  doit  donc  être  cherchée 
dans  les  caractères  de  variabilité  plus  ou  moins  accentuée 
que  présentent  les  phénomènes. 

77.  Pour  les  statistiques  qui  se  font  à  un  moment  donné, 
il  y  a  lieu  de  se  demander  quel  est  le  moment  le  plus  favo- 
rable. Affaire  de  bon  sens  et  d'expérience;  le  choix  de 


11)  Royaume  de  Belgique.  Office  du  travail.  Salaires  et  durée  du  travail 
dans  les  industries  textiles  au  mois  d'octobre  1901,  p.  301.  Bruxelles,  1905. 
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l'époque  ne  se  fixe  pa&  d'après  des  règles  théoriques.  Pour 
certains  relevés  statistiques,  telle  époque  convient; 
pour  d'autres  la  date  favorable  à  une  exécution  conve- 
nable des  opérations  sera  différente.  Si  l'on  veut  recenser 
la  population  industrielle  d'un  pays,  on  ne  choisira  pas 
une  date  à  laquelle  de  nombreux  émigrants  saisonniers  se 
trouvent  absents,  ni  une  période  durant  laquelle  l'activité 
n'est  pas  normale.  On  atteint  des  résultats  très  différents 
dans  les  recensements  agricoles  d'après  l'époque  à  laquelle 
on  fixe  le  dénombrement.  Dans  certains  pays,  dans  certains 
états  sociaux,  la  fixation  du  moment  de  l'observation  peut 
présenter  de  grandes  difficultés.  Ainsi,  dans  l'Inde,  la  date 
du  recensement  se  trouve  conditionnée  d'une  manière  très 
spéciale  :  il  faut  choisir  une  période  de  pleine  lune,  afin  que 
les  agents  recenseurs,  au  nombre  de  deux  millions,  puissent 
accomplir  leur  travail  durant  la  nuit;  de  plus,  la  date  choi- 
sie ne  doit  coïncider  avec  aucune  fête  ou  foire,  ni  avec  les 
jours  regardés  comme  favorables  aux  mariages  et  aux  ablu- 
tions dans  les  fleuves  sacrés,  ni  avec  l'époque  des  pèleri- 
nages vers  des  sanctuaires  vénérés  (1). 

78.  Nous  avons  dit  aussi  que  le  relevé  devait  envisager 
la_durée  des  phénomènes;  c'est  le  dernier  aspect  sous  lequel 
la  notion  de  temps  intervienne  pour  la  fixation  des  carac- 
tères du  relevé. 

Très  souvent,  on  se  borne  à  enregistrer  les  faits  au  mo- 
ment où  ils  se  produisent,  sans  plus,  mais  dans  d'autres 
cas,  non  moins  nombreux,  la  durée  pendant  laquelle  les  phé- 
nomènes continuent  à  se  manifester  est  une  donnée  essen- 
tielle à  recueillir.  Il  ne  s'agit  pas  de  suivre  les  faits  indivi- 
duellement en  assistant,  pour  ainsi  dire,  à  leur  évolution 
complète,  du  moins  cette  condition  n'est  pas  toujours  exi- 
gée, ni  toujours  réalisable.  Nous  passerons  en  revue 


(l)  Census  of  India,  1911.  Introduction. 
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quelques-uns  des  faits  qui  donnent  lieu  à  l'observation  sta- 
tistique sous  cette  forme. 

à)  Phénomènes  dont  la  durée  est  relevée  par  induction. 
Ce  sont  ceux  dont  on  ne  peut  suivre  individuellement  le 
développement  complet.  En  premier  lieu  apparaissent  les 
faits  de  la  vie  humaine  :  la  durée  de  l'existence,  des  unions 
conjugales,  d'une  génération,  etc..  Il  est  essentiel,  pour  la 
connaissance  de  ces  éléments  si  importants,  d'établir  le 
temps  pendant  lequel  ils  existent.  Dans  ce  but,  il  ne  faut  pas 
nécessairement  rechercher  la  durée  de  l'existence  de  tous  les 
hommes  dont  la  naissance  a  été  comptée  dans  les  statis- 
tiques de  la  natalité,  ni  de  tous  les  mariages  qui  ont  été  célé- 
brés. Il  suffit  de  procéder  par  induction  et  de  relever,  à 
une  date  donnée,  celle  d'un  recensement,  l'âge  de  toutes  les 
personnes  recensées.  La  distribution  des  unités  recensées, 
par  catégorie  d'âge,  fournira  la  réponse  à  la  question 
posée,  parce  que,  par  induction,  nous  passons  des  faits  con- 
nus aux  faits  inconnus  en  établissant  la  loi  générale  du  phé- 
nomène. Ainsi,  une  table  de  survie  se  construit  en  se  basant 
sur  le  tableau  de  la  population  par  âge  :  celui-ci  est  l'image, 
comme  dit  Levasseur,  d'une  population  qui  comprend  une 
série  de  générations  ayant  eu  des  chances  diverses  de 
mortalité  et  ayant  d'ordinaire  subi  des  modifications  par 
lY'iirigration  et  l'immigration.  La  méthode  démographique 
de  construction  d'une  table  de  survie  est  basée  sur  le  procédé 
indnctif.  Etant  connus  la  population  par  âges  et  le  nombre 
des  décès  par  âges,  on  détermine,  pour  chaque  période,  le 
rapport  de  ces  deux  nombres;  partant  ensuite  de  la  popu- 
lation ramenée  à  100,000  personnes,  le  statisticien  déduit 
les  décès  afférents  à  chaque  âge  jusqu'au  moment  où  la  dif- 
férence entre  les  deux  termes  devient  nulle  (1). 

b)  Phénomènes  dont  la  durée  est  relevée  par  l'observa- 
tion directe.  Un  grand  nombre  de  faits  rentrent  dans  cette 


(1)  Levassei  r.  La  population  française,  t.  II,  pp.  286-290. 
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catégorie;  par  exemple,  un  des  éléments  servant  à  caracté- 
riser une  grève  est  sa  prolongation  ;  dans  la  statistique  des 
grèves,  on  relève  donc  pour  chaque  conflit  le  nombre  de 
jours  de  chômage.  Pour  les  accidents  de  travail,  une  donnée 
essentielle  est  la  durée  de  l'incapacité,  parce  qu'elle  fait  va- 
rier l'étendue  de  la  charge;  tout  accident  du  travail  est 
porté  dans  les  statistiques  avec  les  indications  relatives  à 
cet  objet.  Les  divisions  adoptées  sont  en  concordance  avec 
la  loi  de  réparation  des  accidents.  Dans  ces  cas  et  dans  une 
quantité  de  cas  semblables,  la  durée  du  phénomène  est  rele- 
vée directement  par  l'observation,  sans  recourir  au  procédé 
inductif. 

III.  —  Le  relevé  considéré  sous  le  point  de  vue  de  l'espace. 

79.  A  proprement  parler,  l'espace  est  sans  bornes.  Au 
delà  de  l'univers  sensible  nous  pouvons  concevoir  une  éten- 
due sans  mesure  assignable,  car  après  un  objet  on  peut  tou- 
jours supposer  qu'il  en  existe  un  autre.  L'espace  dépasse 
donc  les  bornes  de  l'univers  et  est  inconnaissable  en  lui- 
même  ;  la  seule  réalité  sous  laquelle  il  nous  apparaisse  est 
l'étendue  des  corps  situés  dans  l'espace  et  les  relations  de 
leurs  distances. 

Si  telle  est  la  notion  philosophique  de  l'espace,  nous  pou- 
vons en  conclure  que  les  divisions  d'après  lesquelles  nous 
situons  les  corps  et  les  phénomènes  sont  artificielles  dans 
leur  essence  et  que  nous  pouvons  les  faire  varier  selon  que 
le  sujet  de  nos  études  l'exige. Des  géomètres  ont  pu  imaginer 
une  géométrie  à  quatre  dimensions,  bien  que  nos  sens  ne 
perçoivent  que  trois  dimensions  des  corps;  il  serait  aussi 
légitime  pour  le  statisticien  d'adopter  des  mesures  de 
l'étendue  appropriées  à  ses  conceptions  propres,  sans  s'in- 
quiéter si  elles  sont  ou  non  d'un  usage  courant.  Mais,  en 
pratique,  on  n'a  pas  à  recourir  à  des  mesures  nouvelles, 
celles  existantes  suffisent  à  tous  les  besoins.  On  peut  tracer 
parmi  elles  plusieurs  catégories. 
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a)  Divisions  politiques  et  administratives.  Elles  sont 
des  plus  usitées  dans  un  grand  nombre  de  domaines  explo- 
rés par  la  statistique.  Ce  sont  tout  d'abord  l'Etat,  l'unité 
politique  par  excellence,  puis  la  province,  département, 
comté,  quel  que  soit  le  nom  qu'on  lui  donne,  ensuite  des 
divisions  administratives  plus  réduites  :  cercle,  district, 
arrondissement,  canton,  etc.,  enfin,  l'unité  administrative 
primaire,  la  commune. 

b)  Divisions  économiques.  Si  les  divisions  politiques 
conviennent  à  une  foule  de  recherches  statistiques,  il  existe 
des  investigations  qui  réclament  une  base  différente,  tant 
pour  l'organisation  des  recherches  que  pour  la  présenta- 
tion des  résultats;  lorsque  le  caractère  d'une  statistique  est 
nettement  économique,  on  se  demande  pour  quelle  raison 
on  continue  à  lui  appliquer  des  divisions  d'ordre  politique. 
Ainsi,  dans  les  statistiques  agricoles,  il  semblerait  plus  sage 
d'utiliser  la  division,  existante  et  non  à  créer,  de  régions 
agricoles,  plutôt  que  de  s'en  référer  à  une  localisation  des 
faits  basée  sur  une  conception  étrangère  au  but  de  la  statis- 
tique.Tous  les  pays  présentent  de  vastes  divisions  agricoles, 
par  nature  de  terrains,  qui  répondent  mieux  que  toute  autre 
à  une  statistique  de  la  production  et  de  l'élevage.  Dans  les 
statistiques  industrielles,  les  divisions  sont  moins  nettes  et 
dès  lors  moins  facilement  utilisables.  Un  bassin  industriel 
n'est  pas  nettement  délimité  comme  peut  l'être  une  région 
agricole.  Cette  formule  a  été  employée  pour  la  grande  in- 
dustrie charbonnière  et  métallurgique,  mais  elle  n'a  pas  de 
sens  en  ce  qui  concerne  les  agglomérations  urbaines,  si 
fécondes  en  industries,  ni  en  ce  qui  regarde  les  régions  de 
petite  industrie.  Nous  avons,  en  Belgique,  le  bassin  de 
Charleroi,  du  Borinage,  du  Centre,  de  Liège,  mais  il 
n'existe  pas  de  dénomination  semblable  pour  le  Brabant 
ni  les  Flandres.  Bien  que  cette  division  par  bassin  soit 
séduisante  en  théorie,  elle  n'est  pas  susceptible  d'être  utili- 
sée en  pratique  dans  tous  les  cas.  Il  faut  se  borner  à  en  sou- 
haiter l'usage  dans  des  cas  spéciaux. 
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Enfin,  on  peut  concevoir  aussi  des  subdivisions  du  terri- 
toire, ayant  un  caractère 'économique,  basées  sur  des  rela- 
tions démographique  s.  Telles  sont  celles  qui  subdivisent  la 
population  entre  les  centres  urbains  et  les  régions  rurales, 
entre  les  grandes  villes,  celles  de  moyenne  importance  et  les 
petites  villes,  ou  simplement  répartissent  une  population 
en  tenant  compte  du  nombre  d'habitants  des  localités  où 
elle  vit.  Ces  divisions  sont  importantes  dans  les  recherches 
économiques  et  sociales  ;  la  démographie  les  utilise  dans  le 
but  de  déduire,  des  nombres  ainsi  groupés,  des  considéra- 
tions d'ordre  économique. 

c)  Divisions  naturelles.  Elles  traduisent,  sous  une 
forme  schématique,  l'influence  des  milieux.  Elles  sont  de 
mise  dans  les  pays  présentant  une  grande  superficie,  mais 
non  dans  des  Etats  resserrés  dans  d'étroites  limites.  A  ce 
point  de  vue,  on  peut  distinguer  entre  les  régions  de  plaines 
et  de  montagnes,  entre  les  côtes  et  l'intérieur,  entre  le  Nord 
et  le  Midi,  entre  l'Est  et  l'Ouest,  entre  une  des  régions  quel- 
conques et  le  centre,  entre  la  campagne  et  la  forêt,  entre  les 
bassins  fluviaux. 

On  aperçoit  immédiatement  la  richesse  des  aperçus 
auxquels  on  peut  se  livrer  en  faisant  ainsi  varier  le 
point  de  vue  auquel  on  se  place  :  aussi  les  divi- 
sions de  l'espace  intéressent-elles  la  statistique  non  seule- 
ment dans  la  phase  de  la  réunion  des  données,  mais  aussi 
dans  celles  de  la  présentation  et  de  l'interprétation.  Dans 
un  pareil  système,  l'unité  d'observation  serait  la  commune, 
puis  on  grouperait  par  régions  les  communes  présentant  des 
caractères  analogues. 

80.  Quelle  est  la  relation  systématique  existant  entre  le 
relevé  et  les  divisions  conventionnelles  ou  naturelles  dont 
il  vient  d'être  question f  Nous  l'avons  exprimée  en  disant 
que  le  relevé  doit  être  aussi  étendu  et  aussi  particu- 
larisé que  possible.  Aussi  étendu  qu'il  se  peut,  en  ce  sens 
que  les  phénomènes  à  relever  doivent  l'être  partout  où  ils 
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se  produisent;  en  Jes  observant  partout,  on  est  certain  de 
n'omettre  aucune  des  qualités  qu'ils  présentent  et  d'obtenir 
une  mesure  exacte  de  leur  fréquence.  Aussi  particularisé 
qu'il  est  possible,  afin  que  les  détails  s'aperçoivent;  qu'ils 
ne  se  fondent  pas  dans  une  masse  peu  homogène,  sans  pré- 
cision et  sans  originalité.  Les  bornes  politiques  de  l'Etat 
limitent  le  relevé  par  en  haut,  comme  l'étendue  de 
la  commune  ou  de  la  plus  petite  division  administra- 
tive le  limite  par  en  bas.  Les  opérations  statistiques 
de  grande  envergure  s'arrêtent  à  l'Etat.  Pratiquement  on 
n'a  jamais  été  plus  loin.  Ce  que  l'on  désigne  du  nom  de  sta- 
tistiques internationales  ne  mérite  pas  ce  nom  dans  l'accep- 
tion où  on  le  prendrait  en  parlant  du  relevé.  Ce  n'est  point 
un  relevé  unique,  décrété  par  une  réunion  d'Etats,  s 'éten- 
dant simultanément  aux  territoires  appartenant  à  plusieurs 
gouvernements,  exécuté  d'après  des  instructions  uni- 
formes, publié  sur  un  plan  unique.  Les  statistiques  inter- 
nationales sont  simplement  des  compilations  de  statistiques 
nationales,  réunies  et  mises  bout  à  bout,  non  sans  hiatus,  et 
présentant  dans  leur  ensemble  toutes  les  lacunes  des  statis- 
tiques particulières,  en  y  ajoutant  les  défauts  résultant  du 
manque  d'uniformité  dans  les  définitions  et  des  différences 
dans  l'exécution  et  la  mise  en  œuvre.  Ces  statistiques  sont 
internationales  de  nom,  nationales  de  fait.  Il  est  donc  per- 
mis de  dire  que  l 'Etat  forme  actuellement  la  limite  extrême 
d'extension  des  investigations  statistiques. 

Se  trouverait-on  encore  dans  les  limites  du  relevé  direct 
si,  au  lieu  de  porter  sur  l'Etat  entier,  les  statistiques  s'ar- 
rêtaient aux  limites  d'une  province,  ou  d'un  groupe  de  pro- 
vinces ou  de  divisions  analogues?  On  pourrait  être  tenté 
de  répondre  affirmativement  en  considérant  que  le  relevé 
direct  embrasse  toutes  les  unités  comprises  dans  une 
définition  générale.  Or,  une  définition  pourrait  limi- 
ter à  une  province  unique  les  phénomènes  à  observer.  La 
raison  de  décider  la  négative  est  que,  dans  un  cas  semblable, 
la  limitation  de  l'observation  à  une  seule  province  quand 
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le  phénomène  peut  être  relevé  dans  plusieurs  ou  dans 
toutes,  est  arbitraire  et  serait  contraire  à  la  règle  suivant 
laquelle  le  relevé  doit  être  aussi  étendu  que  possible.  On 
quitterait  le  domaine  du  relevé  direct  pour  entrer  dans-  celui 
de  la  monographie. 

La  limite  inférieure  de  l'observation  statistique  est  la 
plus  petite  division  administrative,  la  commune.  Les  divi- 
sions économiques  et  naturelles  sont  toujours  plus  étendues 
que  la  commune.  C'est  la  vie  économique  la  plus  étroitement 
localisée  qui  fournit  parfois  le  plus  de  données  intéres- 
santes et  c'est  en  l'observant  qu'on  se  rapproche  le  plus  de 
la  réalité  et  de  la  vie.  Pour  l'étude  démographique,  nous 
n'apercevons  pas  dans  tous  les  cas  le  même  intérêt  de  choi- 
sir la  commune  comme  unité  d'espace,  parce  que  la  plupart 
des  faits  relatifs  à  la  population  demandent,  avant  tout,  de 
vastes  ensembles  où  disparaissent  les  caractères  acciden- 
tels, mais  pour  certaines  questions,  il  n'est  pas  inutile  de 
pousser  jusqu'à  là  le  soin  du  détail.  Ainsi  en  est-il,  par 
exemple,  de  la  densité  de  la  population  :  l'existence  d'une 
grande  ville  suffit  à  augmenter  beaucoup  le  coefficient  de 
la  densité  de  la  population  dans  un  canton  ou  arrondisse- 
ment administratif.  Dans  un  même  arrondissement  admi- 
nistratif —  celui  de  Bruxelles  —  on  notait,  en  1912,  des  dif- 
férences dans  la  densité  de  la  population  allant  de  208  à 
28,641  habitants  par  kilomètre  carré  dans  les  différents 
cantons  de  milice.  La  moyenne  pour  l'arrondissement  admi- 
nistratif (967),  ne  donne  aucune  idée  des  différences 
énormes  qui  se  remarquent  dans  les  parties  dont  elle 
se  compose. 

IV.  —  Les  procédés  et  les  organes  du  relevé. 

81.  Pour  introduire  de  l'ordre  dans  un  exposé  nécessai- 
rement complexe,  nous  avons  indiqué,  dans  les  paragraphes 
précédents,  quels  sont  les  phénomènes  à  comprendre  dans 
le  relevé  et  les  conditions  auxquelles  ils  doivent  satisfaire 
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pour  pouvoir  être  isolés  de  ceux  qui  restent  en  dehors  de 
l'opération  statistique.  Les  limites  de  temps  et  d'espace  ont 
aussi  été  analysées  dans  leurs  caractères  généraux.  Ce  qui 
précède  pourrait  constituer  la  préparation  théorique  du 
relevé  ;  la  phase  exposée  dans  ce  paragraphe  peut  être  con- 
sidérée comme  la  préparation  pratique.  Elle  répond  à  la 
double  question  que  voici  :  de  quelle  nature  sont  les  docu- 
ments à  utiliser  pour  le  relevé?  Par  quels  moyens  arrive- 
t-on  à  connaître  les  faits  compris  dans  la  sphère  des  obser- 
vations? Elle  embrasse  l'examen  de  deux  groupes  de  pro- 
blèmes :  les  moyens  matériels  (bulletin,  questionnaire,  etc.) 
et  les  moyens  personnels  (agents  du  relevé). 

A.  — ■  Le  bulletin  ou  questionnaire. 

82.  Tout  relevé  statistique  ne  nécessite  pas  l'emploi  ni 
d'un  bulletin  ni  d'un  questionnaire.  La  distinction  établie 
plus  haut  entre  le  relevé  automatique  et  le  relevé  réfléchi 
reprend  ici  toute  son  importance.  Dans  le  relevé  continu, 
la  nature  des  faits  à  observer  est  déjà  indiquée  par  les  dis- 
positions législatives  ou  administratives  en  vertu  desquelles 
le  relevé  s 'exécute  ;  presque  toujours,  ces  mêmes  disposi- 
tions prescrivent  la  façon  dont  les  faits  doivent  être  anno- 
tés, consignés  dans  des  registres  ou  des  formules  dont  la 
forme  est  arrêtée  d'une  manière  fixe.  Le  statisticien  n'a 
pas  à  s'en  occuper  directement;  il  les  utilise  telles  qu'il  les 
trouve.  Bien  entendu,  si,  à  l'expérience,  ces  documents  sont 
jugés  peu  ou  mal  utilisables  par  la  statistique,  on  pourra  les 
modifier  de  manière  à  donner  satisfaction  à  des  réclama- 
tions légitimes.  Mais  ceci  est  l'exception.  En  thèse  générale, 
le  statisticien  est  forcé,  dans  ce  domaine,  de  se  contenter  de 
ce  qu'il  trouve.  Il  serait  désirable  qu'un  accord  s'établît  tou- 
jours entre  les  organes  administratifs  et  scientifiques,  afin 
que  le  fond  et  la  forme  des  documents  du  relevé  automa- 
tique répondent  à  toutes  les  exigences  scientifiques  et  no- 
tamment que  le  point  de  vue  mathématique  ne  soit  pas  éli- 
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miné  des  considérations  se  rapportant  à  cet  objet.  C'est  une 
cause  de  graves  mécomptes  et  l'occasion  de  pertes  de  temps 
et  d'argent  inappréciables. 

Conçoit-on,  par  exemple,  que  l'indication  de  charges 
financières  à  mettre  en  relation  avec  le  nombre  probable  de 
bénéficiaires  et  l'âge  de  ceux-ci  puisse  être  arrêtée  dans  sa 
forme  sans  des  études  préalables  à  confier  à  un  actuaire? 
La  chose  peut  paraître  inimaginable,  mais  il  en  a  été  par- 
fois ainsi.  D'informes  tableaux,  décorés  pour  la  cir- 
constance du  nom  de  «  statistiques  »,  continuent  à  être  rem- 
plis avec  application  par  des  légions  de  commis,  sans  que 
la  science  ou  même  une  pratique  éclairée  puissent  espérer 
en  retirer  jamais  le  moindre  avantage. 

Parmi  les  documents,  dressés  dans  un  autre  but,  utilisés 
par  la  statistique  néanmoins,  citons  les  registres  de  l'état 
civil,  les  états  dressés  en  matière  de  justice  criminelle,  les 
documents  tenus  par  les  agents  du  service  des  douanes  et 
des  accises,  les  registres  de  population  là  où  ils  existent  et 
sont  tenus  avec  soin.  On  peut  aussi  se  baser  sur  ces  docu- 
ments, non  pour  les  utiliser  exclusivement,  mais  pour  y 
trouver  le  point  de  départ  de  recherches  plus  étendues  :  tel 
fut  le  cas,  en  Belgique,  lors  du  recensement  de  l'industrie 
et  des  métiers  au  mois  d'octobre  1896,  où  l'on  se  servit  des 
registres  de  population  pour  connaître  —  en  l 'absence  d 'un 
recensement  général  des  professions  —  le  nom,  l'adresse 
et  l'industrie  exercée  par  les  patrons  comme  par  les  ou- 
vriers; un  bulletin  détaillé  était  ensuite  remis  à  ces  per- 
sonnes. 

Tous  les  documents  officiels  ne  méritent  pas  la  même 
confiance,  et  dans  un  même  document  il  se  trouve  des  don- 
nées méritant  moins  de  créance  que  d'autres.  Il  appartient 
à  la  critique,  dont  les  principes  seront  exposés  plus  loin, 
d'opérer  la  ventilation  nécessaire  entre  les  différentes 
données.  L'origine  officielle  du  document  ne  doit  pas 
aveugler  le  statisticien.  D'ailleurs  dans  un  même  re- 
gistre se  trouvent  confondues  des  données  dont  l'origine 
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est  très  différente  :  les  unes  pourraient  être  certifiées  par 
le  fonctionnaire  qui  les  a  recueillies,  les  autres  sont  sim- 
plement reçues  à  titre  de  déclarations  faites  par  les-  inté- 
ressés, sans  aucun  contrôle  par  le  fonctionnaire  qui  les 
reçoit.  On  en  trouve  des  exemples  dans  la  statistique  com- 
merciale où  il  y  a  quantité  de  données  dont  les  unes  réu- 
nissent des  garanties  presque  absolues,  tandis  que  d'autres 
présentent  un  aléa  excessif. 

83.  Pour  le  relevé  réfléchi,  organisé  dans  un  but  déter- 
miné, l'instrument  de  l'observation  doit  être  fabriqué  de 
toutes  pièces  :  c'est  le  bulletin  ou  questionnaire.  On  donne  ce 
nom  au  document  destiné  à  recevoir  les  réponses  des  per- 
sonnes comprises  dans  le  relevé.  Le  comptage  des  unités 
et  l'addition  des  données  numériques  contenues  dans  les 
réponses  données  au  bulletin  permettent  de  former  les 
masses  statistiques  qui  figurent  dans  les  tableaux  de  pré- 
sentation. 

Le  mot  bulletin  est  d'habitude  employé  pour  désigner  le 
document  dont  on  fait  usage  dans  les  recherches  de  grande 
envergure  faisant  partie  du  relevé  direct.  On  dit  un  bulletin 
de  recensement,  non  un  questionnaire  de  recensement... 
Le  mot  questionnaire  a  un  sens  plus  étendu,  il  se  réfère  à  un 
document  détaillé,  comme  on  peut  en  employer  dans  un 
relevé  s 'adressant  à  un  nombre  restreint  de  personnes;  on 
dit,  de  préférence,  un  questionnaire  d'enquête.  Toutefois- 
la  distinction  ci-dessus,  basée  sur  l'usage,  n'a  rien  d'absolu. 

Le  bulletin  employé  dans  les  relevés  étendus  est  de  deux 
sortes  :  le  bulletin  collectif  et  le  bulletin  individuel. 

On  appelle  bulletin  collectif  le  document  destiné  à  rece- 
voir des  réponses  se  rapportant  à  plusieurs  personnes  for- 
mant une  collectivité  familiale,  économique,  ou  simplement 
constituant  une  réunion  de  fait. 

Dans  un  recensement  de  la  population  on  peut  employer 
le  bulletin  collectif,  remis  au  chef  de  la  famille,  afin  que 
celui-ci  y  porte  toutes  les  indications  relatives  aux  personnes 
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vivant  avec  lui.  Au  lieu  de  la  famille,  on  peut  adopter, 
comme  mesure  collective,  le  ménage,  qui  n'implique  pas  que 
les  personnes  vivant  ensemble  soient  unies  par  des  liens  de 
parenté.  En  Belgique  le  document  du  recensement  de  la 
population  est  un  bulletin  de  ménage  dans  lequel  toutes  les 
personnes  faisant  partie  du  ménage  et  ayant  leur  résidence 
habituelle  dans  la  maison,  y  compris  celles  qui  sont  momen  - 
tanément absentes,  doivent  avoir  consigné  leur  nom  de 
famille,  leur  prénom,  le  degré  de  parenté  avec  le  chef  de 
ménage,  leur  état  civil,  profession,  fonction  ou  situa- 
tion, etc.  Il  y  a,  en  plus,  un  bulletin  spécial  personnel  uti- 
lisé pour  l'inscription  des  personnes  qui,  sans  avoir  leur 
résidence  habituelle  dans  la  maison,  s'y  trouvent  acciden- 
tellement au  moment  du  recensement,  et  un  bulletin  spé- 
cial collectif  destiné  au  relevé  des  personnes  réunies  dans 
les  pensionnats,  casernes,  établissements  charitables,  etc. 

L'Italie  avait  adopté  pour  son  recensement,  en  1881,  le 
bulletin  de  famille,  principalement  parce  que  le  bulletin 
individuel  propre  à  chaque  membre  de  la  famille  se  serait 
adressé  à  un  trop  grand  nombre  de  personnes  ne  sachant  ni 
lire  ni  écrire.  En  1901  ce  pays  a  substitué  le  bulletin  indivi- 
duel au  bulletin  de  famille. 

Le  bulletin  individuel  ne  doit  recevoir  que  les  indica- 
tions relatives  à  une  seule  personne.  Il  est  en  usage  dans 
presque  tous  les  pays,  mais  il  est  presque  toujours  accom- 
pagné d'autres  bulletins  ayant  le  même  caractère  que  le 
bulletin  collectif.  En  France,  bien  que  le  bulletin  individuel 
soit  l'instrument  principal  du  recensement,  il  y  a  aussi  un 
bulletin  par  famille  et  un  bulletin  par  maison.  De  plus,  cer- 
taines catégories  de  population  doivent  être  comptées  à 
part,  comme  les  lycées,  les  séminaires,  les  hospices,  les 
asiles  d'aliénés,  etc. 

84.  Le  bulletin  collectif  ou  de  famille  a  été  adopté,  au 
début  de  l'ère  des  recensements,  dans  presque  tous  les  pays 
et  il  est  encore  usité  dans  quelques-uns  de  ceux  qui  sont 
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parmi  les  plus  avancés  en  fait  d'organisation  statistique. 
Dans  un  état  social  qui  ne  comporte  pas  un  développement 
général  de  l'instruction,  il  s'impose  afin  de  ne  pas  multi- 
plier inutilement  les  difficultés  :  dans  la  famille  on  a  chance 
de  rencontrer  quelqu'un  sachant  écrire  et  pouvant  répondre 
aux  questions  du  bulletin  de  ménage,  ou  l'agent  recenseur 
peut  écrire  lui-même  les  réponses  qui  lui  sont  données  ver- 
balement. Dans  l'Inde  anglaise  le  bulletin  collectif  est  l'ins- 
trument du  recensement.  M.  Gait,  commissaire  pour  le  der- 
nier Census,  a  exposé  avec  détail  les  raisons  qui,  dans  l'Inde 
ont  fait  préférer  le  bulletin  collectif  au  bulletin  individuel  ; 
il  indique,  outre  les  raisons  précédentes,  l'utilité  qu'il  y  a,  au 
cours  de  la  revision,  à  comparer  entre  elles  les  réponses 
données  par  les  différentes  personnes  composant  un  même 
ménage;  il  y  ajoute  une  raison  d'ordre  matériel,  à  savoir 
que  les  bulletins  individuels  auraient  formé  un  volume 
beaucoup  plus  fort  que  les  bulletins  de  ménage. 

Lors  du  recensement  de  1881,  l'Italie  avait  adopté  le  bul- 
letin collectif  à  raison  du  manque  général  d'instruction  et 
aussi  pour  encourager  les  communes  à  établir  des  registres 
de  population  basés  sur  les  bulletins  collectifs.  Cette  attente 
a  été  complètement  déçue,  alors  qu'en  Belgique  les  re- 
gistres de  population  sont  tenus  dans  toutes  les  com- 
munes avec  le  plus  grand  soin;  pour  renouveler  les  re- 
gistres de  population,  il  faut  nécessairement  se  baser  sur 
le  recensement  effectué  au  moyen  du  bulletin  collectif  de 
ménage. 

Le  bulletin  collectif  a  beaucoup  perdu  de  sa  faveur  à  rai- 
son de  ce  fait  que,  dans  la  suite  des  opérations  statistiques 
il  ne  peut  être  utilisé  directement  sans  de  nombreux 
inconvénients.  Aussi,  dans  les  pays  qui  ont  conservé  le 
bulletin  collectif  le  complète-t-on  en  faisant  transcrire  sur 
des  fiches  les  indications  relatives  à  chaque  personne,  indi- 
viduellement, comprise  dans  le  bulletin  de  ménage.  Il  en  a 
été  ainsi  aux  Indes,  où,  lors  du  dernier  recensement,  on  a 
dû  confectionner  plus  de  315  millions  de  fiches  indivi- 
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duelles.  Depuis  1876,  on  a  renoncé,  en  Belgique,  à  procéder 
au  dépouillement  des  bulletins  de  ménage  par  voie  de  poin- 
tage et  l'on  a  chargé  les  agents  recenseurs  de  reporter  sur 
des  fiches  individuelles  toutes  les  indications  relatives  aux: 
personnes  figurant  sur  le  bulletin  collectif.  C'est  par  lu 
comptage  des  fiches  qu'on  détermine  actuellement  le  nom- 
bre de  personnes  de  chaque  catégorie.  Evidemment,  la 
transcription  des  données  sur  fiches  exige  du  temps  et  de 
l'argent,  mais  ces  inconvénients  sont  compensés  par  la 
sûreté  plus  grande  des  résultats  :  en  combinant,  par 
exemple,  les  couleurs  et  les  profils  des  fiches,  on  arrive  à 
une  précision  qu'on  ne  pourrait  atteindre  avec  le  procédé 
du  pointage.  La  confection  des  fiches  est  comprise  dans  la 
rémunération  des  agents  recenseurs.  La  dépense  n'est  pas 
très  lourde  dans  des  pays  comme  l'Inde,  mais  s'il  fal- 
lait appliquer  ce  système  dans  un  pays  à  hauts  salaires  la 
dépense  s'élèverait  à  un  chiffre  inacceptable. 

85.  Cette  dernière  considération  a  engagé  les  statisticiens 
à  substituer  au  bulletin  collectif  le  bulletin  individuel.  En 
principe,  les  indications  contenues  dans  ce  bulletin  sont 
relatives  à  un  seul  individu,  de  telle  façon  qu'elles  consti- 
tuent elles-mêmes  des  fiches,  sans  que  l'on  doive  procéder  à 
la  transcription  des  données  du  bulletin  collectif. 

Théoriquement,  l'introduction  de  la  fiche  individuelle  est 
une  amélioration  sur  le  système  suivi  auparavant,  mais  ce 
genre  de  bulletin  ne  peut  être  employé  utilement  que  dans 
les  pays  où  le  niveau  général  de  l'instruction  est  suffisam- 
ment élevé.  Il  n'est  pas  sans  présenter  d'ailleurs  certains 
inconvénients  :  ainsi,  l'uniformité  extérieure  des  bulletins 
est  une  source  d'erreurs  dans  le  classement;  si  les  diffé- 
rentes catégories  de  personnes  pouvaient  être  distinguées- 
au  moyen  de  la  couleur  du  bulletin,  on  aurait  beaucoup 
moins  de  classements  défectueux,  mais  il  ne  peut  être 
question  de  charger  l'agent  recenseur  de  répartir  les 
bulletins  de  différentes  sortes  ;  ce  système  comporte- 
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rait,  de  plus,  une  grande  part  d'arbitraire,  chacun  uti- 
lisant le  bulletin  qui  lui  aurait  été  remis  plutôt  que  de 
réclamer,  en  cas  d'erreur,  un  bulletin  différent,  ap- 
proprié à  la  situation  réelle  (1).  On  ne  peut  non  plus, 
sur  le  bulletin  originaire,  substituer  aux  réponses  elles- 
mêmes  des  signes  conventionnels  qui  facilitent  la  lec- 
ture, comme  on  le  fait  lorsque  les  fiches  sont  directement 
confectionnées  par  le  service  statistique.  Enfin,  souvent, 
l'écriture  est  illisible,  les  bulletins  sont  maculés,  d'un  ma- 
niement difficile  et  désagréable,  les  noms  sont  incorrecte- 
ment orthographiés,  etc. 

Tous  ces  inconvénients,  qui  sont  réels,  n'empêchent  pas 
le  bulletin  individuel  de  l'emporter  sur  le  bulletin  collectif 
au  point  de  vue  de  la  fabulation. 

Le  bulletin  individuel  est  strictement  propre  à  une  per- 
sonne seule  dans  les  relevés  démographiques.  Dans  les  rele- 
vés économiques,  il  faut  un  peu  étendre  les  questions  qu'il 
comprend;  ainsi,  à  un  chef  d'entreprise,  on  pourra  deman- 
der non  seulement  les  renseignements  qui  le  concernent 
personnellement,  mais  encore  ceux  qui  se  rapportent  à  son 
entreprise  :  nombre,  s«xe,  qualité  des  ouvriers  et  employés, 
force  motrice  utilisée,  etc.  Ces  données  ne  se  rapportent 
pas  strictement  à  la  personne  même, mais  à  l'entreprise  diri- 
gée par  l'auteur  du  document;  elles  permettent  d'établir 
un  contrôle  entre  les  réponses  individuelles  données  par  les- 
ouvriers  d'une  part  et  le  chef  d'entreprise  d'autre  part. 

86.  Comme  exemple  de  bulletin  individuel,  nous  repro- 
duisons, ci-après,  le  modèle  de  bulletin  employé  en  France, 
lors  du  recensement  général  de  la  population  effectué  le 
4  mars  1906. 


(1)  Royaume  de  Belgique.  Ministère  de  l'Industrie  et  du  Travail  (Office  du 
Travail).  Jiccetisement  de  l'industrie  et  du  commerce,  1910.  Introduction, 
p.  XXI,  col.  II. 
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BULLETIN  INDIVIDUEL 

il  doit  être  établi  un  bulletin  pour  chaque  personne  qui  a  passé  dans  la  maison 
la  nuit  du  3  au  4  mars  1906,  même  pour  les  enfants  en  bas-àge. 


i  Nom  de  famille 
1.  Nom,  sexe,  j  Prénoms 


2.  Date  et  lieu  l  Né  en  l'année  1     ,  le 
de  naissance  j  dans  la  commune  d 


6.  Instruction     Savez-vous  lire  et  écrire  ? 


7.  Profession 


8.  — 

Si  vous  êtes  patron,  chef  d'établisse- 
ment, dans  une  profession  agricole,  in- 
dustrielle, commerciale,  libérale,  ou 
ouvrier  à  façon  travaillant  chez  vous, 
répondre  aux  questions  suivantes  : 

a)  Raison  sociale,  nom,  adresse  de 
l'établissement  ou  de  l'entreprise  que 
vous  dirigez  : 

Rue  ,  n° 

Commune  d 
Arrondissement  d 

b)  Combien  de  personnes  occupez- 
vous  actuellement,  au  total,  dans  cet 
établissent 

(Ne  pas  comprendre  les  patrons,  ni  les 
ouvriers  à  domicile,  les  domestiques 
exclusivement  attachés  à  la  personne). 

c)  Etes-vous  ouvrier  à  façon  travaillant 
à  votre  domicile? 


Sexe  (m.  ou  f.) 

Indiquer  la  colonie  ou 
le  pays  étranger  : 


Si  vous  travaillez  sous  la  direction  ou 
au  service  d'autrui.  comme  ingénieur, 
employé,  ouvrier,  journalier,  garçon, 
apprenti,  domestique,  etc. 

(Les  ouvriers  à  façon  à  domicile  doivent 
s'inscrire  dans  la  partie  de  gauche.) 

a)  Nom  et  adresse  du  patron,  de  l'en- 
treprise, de  l'administration  qui  vous 
emploie  : 

Rue 

Commune  d 

b)  Nature  de  la  profession,  de  l'indus- 
trie, du  commerce  de  votre  patron  ou  de 
l'administration  qui  vous  emploie  : 

c)  Si  vous  êtes  sans  emploi  : 
Depuis  combien  de  jours  ? 
Est-ce  pour  cause  de  maladie  ? 


,         ..„„,  I  né  Français?  ou  naturalisé  Français? 

3   Nationalité  J  Etes-vous  J    ,         v  v 
1  (  étranger  ?  de  quel  pays  ? 

Etes-vous  :  célibataire  ?        marié  ?        veuf  ?        divorcé  ? 

i.  Etat  de  fa-  )  Depuis  combien  d'années  avez-vous  été  marié  ? 

mille.  .  .  .  J  Combien  avez-vous  eu  d'enfants? 

'         Encore  vivants  ?  Morts  (mort-nés  non  compris)? 

5.  Résidence.  !  Habitez- vous  dans  la  commune?       Ou  y  êtes-vous  de  passage 


Quelle  est  votre  profession  principale? 

Si  vous  en  exercez  une  autre,  laquelle  ? 
(Indiquer  la  profession,  l'industrie,  le  commerce,  sous  une  forme 
précise  et  détaillée;  si  vous  n'exercez  aucune  profession, 
répondre  néant  et  ne  pas  répondre  aux  questions  suivantes). 


Renseignements  sur  la  profession  ou  l'industrie  principale 
à  la  date  du  recensement. 
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En  même  temps  que  le  bulletin  individuel,  principal 
instrument  employé  pour  le  recensement,  le  dénombrement 
de  la  population  en  ÏVance  utilise  deux  bulletins  collectifs  : 
une  feuille  de  ménage  et  un  bordereau  dressé  pour  chaque 
maison.  Ce  dernier  document,  en  forme  de  chemise,  doit 
contenir  toutes  les  feuilles  de  ménage  de  la  maison;  il  est 
dressé  par  l'agent  recenseur  d'après  les  résultats  portés 
sur  les  feuilles  de  ménage,  après  enquête  sur  place,  si  c'est 
nécessaire,  pour  compléter  le  tableau.  La  feuille  de  ménage 
doit  être  remplie  par  les  recensés  eux-mêmes.  Voici  le  mo- 
dèle de  la  feuille  utilisée  pour  le  recensement  de  1906  : 
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Feuille  de  Ménage 


Ménage  de  M  

Rue  

Profession  

Nombr  de  personnes  composant  le  ménage  (présentes  ou  absentes, 
mais  non  compris  les  personnes  de  passage)  


Habitation.  —  Nombre  de  pièces  destinées  à  l'habitation  des  membres  du  ménage  : 

(On  comptera  comme  pièce  tout  compartiment  d'une  maison,  destiné  à  l'habitation, 
séparé  des  autres  par  des  cloisons  allant  jusqu'au  plafond  et  pouvant  recevoir  un  lit 
d'adulte.)  Comprendre  la  cuisine,  l'antichambre,  les  cabinets  de  toilette  assez  grands 
pour  pouvoir  contenir  un  lit,  les  chambres  de  domestiques,  même  séparées  du  loge- 
ment, mais  non  les  lieux  d'aisances;  ne  comprendre  les  boutiques,  ateliers,  etc.,  que 
lorsque  une  ou  plusieurs  personnes  y  passent  habituellement  la  nuit. 

Liste  nominative  des  membres  du  ménage  : 

Les  noms  doivent  être  inscrits  dans  l'ordre  suivant  :  1°  le  chef  de  ménage  (père  ou 
mère  de  famille)  ;  2°  la  femme  ;  3°  les  enfants;  4°  les  autres  parents  faisant  partie  du 
ménage  ;  5°  les  domestiques;  6°  les  personnes  étrangères  à  la  famille. 


Signaler  ici  les  mem- 
bres du  ménage  qui 
seraient  aveugles  et 
ceux  qui  seraient 
sourds-muets 


1°  Membres  du  ménage  présents  : 

1 
2 
3 
4 
5 
6 
7 
S 
9 
10 

2°  Membres  du  ménage  absents  : 

On  comprendra  dans  cette  section  les  membres  du  ménage  en  voyage  ou  malades 
dans  les  hôpitaux,  ou  travaillant  au  dehors,  mais  on  n'y  comprendra  pas  les  enfants 
placés  chez  une  nourrice,  les  militaires,  les  élèves  internes  des  établissements 
d'instruction  publics  ou  privés,  les  individus  en  prison  ou  dans  les  hospices  et  asiles 
d'aliénés. 

1 

2 

3 
4 

5 

3°  Hôtes  de  passage  (voyageurs,  militaires  en  permission, 
élèves  internes  on  congé,  etc.)  : 

1 
2 

3 
4 


Nom  de  famille 


Prénoms 


Age 


Relation  de  pa- 
renté ou  autre 
avec  le  chef  de 

t  ménage. 
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87.  La  rédaction  du  bulletin  ou  questionnaire  ne  peut 
être  isolée  du  programme  général,  ni  de  la  mise  en  œuvre 
des  matériaux.  Le  bulletin,  par  les  questions  y  contenues, 
traduit  la  pensée  présidant  à  l'enquête  et  a  pour  but  de  réu- 
nir les  données  à  grouper  dans  les  tableaux.  Il  y  a  une  union 
intime  entre  ces  trois  phases  du  travail  ;  aussi  est-il  à  sou- 
haiter qu'elles  soient  l'œuvre  de  la  personne  chargée  de  la 
direction. 

Les  qualités  essentielles  du  bulletin  ou  questionnaire, 
au  point  de  vue  de  sa  rédaction,  sont  les  suivantes  : 

1°  Le  bulletin  doit  être  succinct,  il  doit  se  borner  à  deman- 
der le  strict  nécessaire.  Il  ne  suffit  pas  qu'une  donnée  soit 
intéressante  pour  qu'elle  ait  droit  à  prendre  place  parmi 
les  questions  à  poser.  Elle  doit,  de  plus,  fournir  un  élément 
essentiel  en  vue  de  l'enquête  et  cette  donnée  doit  être  sus- 
ceptible de  trouver  place  dans  les  tableaux  statistiques.  Si 
cette  dernière  condition  ne  peut  être  réalisée,  il  est  inutile, 
en  général,  de  poser  la  question,  sauf  s'il  s'agit  d'une  ques- 
tion de  contrôle.  L'art  ne  consiste  pas  à  multiplier  les 
points  de  vue,  mais  à  faire  concorder  toute  chose  vers  un 
but  unique,  en  tenant  compte  du  caractère  numérique  des 
données.  Les  éléments  trop  difficiles  à  réunir  ne  doivent  pas 
être  compris  au  nombre  des  questions  à  poser.  Il  ne  servi- 
rait à  rien  de  les  obtenir  en  un  endroit  si  on  doit  y  renon- 
cer à  un  autre,  de  les  faire  admettre  par  les  uns  si  les  autres 
se  refusent  à  y  répondre.  La  brièveté  est  une  des  conditions 
du  succès; 

2°  Il  doit  être  clair, de  façon  à  pouvoir  être  compris  de  tout 
le  monde.  Il  ne  faut  pas  perdre  de  vue  qu'un  bulletin  sta- 
tistique s 'adresse  à  des  millions  de  personnes,  dont  le  plus 
grand  nombre  ne  possèdent  qu'une  instruction  rudimentaire. 
Si  les  questions  sont  conçues  en  termes  trop  élevés,  elles 
risquent  de  n'être  pas  comprises.  Non  seulement  les  recen- 
sés, mais  aussi  les  agents  recenseurs  doivent  comprendre 
exactement  la  signification  des  questions  du  bulletin,  de 
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façon  à  donner  les  éclaircissement  qui  leur  sont  demandés 
ou  à  formuler  eux-mêmes  la  réponse. 

L'interprétation  donnée  à  certaines  demandes  est  parfois 
bizarre;  à  la  question  :  «  Travaillez-vous  seul?  sinon,  com- 
bien employez-vous  à  présent  chez  vous  de  membres  de 
votre  famille?  d'ouvriers  salariés?  »,  un  bon  nombre  d'ou- 
vriers à  domicile,  sans  aide  ni  ouvriers,  répondirent 
qu'ils  ne  travaillaient  pas  seuls,  mais  dans  les  locaux  où 
d'autres  personnes  vaquaient  à  leurs  occupations.  Lors  du 
recensement  belge  de  1910  (industrie  et  commerce),  beau- 
coup d'ouvriers,  au  lieu  de  mentionner  le  nom  de  leur  pa- 
tron, sa  profession  et  son  adresse,  comme  on  le  leur  deman- 
dait, répondirent  en  donnant  le  nom  de  l'administrateur 
délégué,  du  directeur-gérant  ou  même  de  l'ingénieur  diri- 
geant l'entreprise  ou  la  division  à  laquelle  ils  étaient  atta- 
chés. D'autres,  au  lieu  de  mentionner  la  localité  où  ils 
allaient  travailler,  indiquèrent  le  domicile  de  leur  patron, 
habitant  une  commune  autre  que  celle  où  l'usine  se  trou- 
vait établie; 

3"  Les  demandes  ne  doivent  pas  pouvoir  être  interprétées 
de  plusieurs  façons; 

4°  Il  sera  simple  et  catégorique,  en  ce  sens,  qu'il  ne  com- 
portera pas  de  réponses  vagues,  mais  autant  que  possible 
des  données  chiffrées,  ou  des  réponses  par  oui  et  par  non 
ne  se  prêtant  pas  à  des  appréciations  subjectives  variables. 
L'idéal  serait  que  la  demande  soit  assez  claire  pour  que  cha- 
cun fût  dispensé  de  recourir  aux  commentaires  et  aux 
instructions  : 

5°  On  n'oubliera  pas,  enfin,  que  tous  les  éléments  du  pro- 
blème à  résoudre  doivent  se  trouver  réunis  dans  le  ques- 
tionnaire. La  statistique  ne  peut  rien  donner  de  plus  que  ce 
qu'où  en  a  recueilli  à  son  intention;  comme  le  dit  Pidgin, 
«  le  fleuve  ne  peut  pas  couler  plus  haut  que  sa'  source  ». 

88.  Au  nombre  des  qualités  du  bulletin,  on  peut  aussi 
compter  la  bonne  disposition  typographique  des  questions 
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posées.  Le  format  du  bulletin  ne  peut  être  ni  trop  grand,  ni 
trop  petit.  Trop  grand,  le  bulletin  est  difficile,  à  manier, 
trop  petit  il  est  incommode  à  classer.  Si  l'on  veut  faire  ser- 
vir le  bulletin  comme  fiche,  lors  du  dépouillement,  on  doit 
éviter  qu'il  contienne  plusieurs  pages  ;  si  on  ne  peut  se  sous- 
traire à  cet  inconvénient,  il  serait  bon  de  disposer  à  gauche, 
vers  le  centre  du  cahier,  une  ligne  de  perforation,  de  façon 
à  permettre  de  l'utiliser  feuille  par  feuille  en  guise  de  fiche. 
Le  meilleur  bulletin  est  celui  qui  tient  sur  une  page,  impri- 
mée d'un  seul  côté.  Si  l'on  doit  s'adresser  aux  recensés  en 
deux  langues,  chaque  côté  de  la  feuille  peut  recevoir  un 
texte  différent. 

La  disposition  typographique  doit  être  surveillée  très 
attentivement.  En  regard  de  chaque  question  il  faut  laisser 
une  place  suffisante  pour  permettre  l'inscription  des  ré- 
ponses par  des  gens  peu  habitués  à  manier  la  plume.  Le 
questionnaire  doit  être  ligné.  Les  questions  de  même  nature 
seront  rapprochées  les  unes  des  autres.  Une  séparation  bien 
nette  sera  marquée  entre  les  diverses  questions.  On  utili- 
sera, pour  attirer  l'attention,  les  caractères  gras  et  ita- 
liques. 

B.  —  Agents  du  relevé. 

89.  Avec  le  travail  de  rédaction  du  bulletin,  comme  avec 
celui  de  la  préparation  du  plan  et  de  la  détermination  des 
unités  de  lieu  et  d'espace,  nous  sommes  déjà  sortis  du 
domaine  de  la  théorie.  Le  choix  des  agents,  les  qualités 
qu'ils  doivent  réunir,  les  instructions  à  rédiger  à  leur  usage, 
dépendent  entièrement  du  domaine  de  l'expérience  et  de  la 
pratique.  Il  ne  faut  pas  croire  que  l'aspect  théorique  des 
problèmes  fondamentaux  de  la  statistique  soit  beaucoup 
plus  abstrait  que  leur  face  pratique;  tout  au  contraire,  un 
statisticien  vraiment  averti  des  difficultés  de  sa  branche, 
sera  souvent  d'avis  que  les  problèmes  les  plus  délicats  sont 
ceux  où  il  faut  tenir  compte  de  l'équation  personnelle  de 
l'enquêteur  et  du  recensé. 
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Le  bulletin  est  l'instrument  matériel  de  la  statistique; 
l'agent  recenseur  en  est  l'instrument  personnel.  Les  deux 
sont  habituellement  interdépendants,  mais  quelquefois,  on 
peut  faire  parvenir  aux  intéressés  les  documents  statis- 
tiques qu'ils  ont  à  remplir  sans  avoir  recours  à  l'intermé- 
diaire d'un  agent.  Ceci  nous  amène  naturellement  à  con- 
sidérer les  méthodes  générales  adoptées  pour  la  distribu- 
tion de&  bulletins  ou  questionnaires. 

Pour  cet  exposé,  il  nous  faut  un  peu  dépasser  notre  cadre 
et  dire  quelques  mots  de  certaines  méthodes  dont  nous  au- 
rions dû  parler  à  propos  du  relevé  indirect.  Une  méthode 
fort  simple,  dont  on  a  fait  un  grand  usage  aux  Etats-Unis, 
consiste  à  envoyer  aux  personnes  les  plus  qualifiées  des 
questionnaires  qu'elles  sont  priées  de  remplir  :  l'envoi  et 
le  retour  des  questionnaires  se  font  par  la  poste,  ce  qui 
supprime  toute  intervention  d 'un  agent  enquêteur.  Le  choix 
des  personnes  à  qui  l'on  s'adresse  n'est  pas  aussi  difficile 
qu'on  pourrait  le  supposer,  pourvu  qu'on  puisse  se  guider 
sur  un  recensement  général  assez  récent.  D 'après  le  recen- 
sement belge  de  1910,  il  suffit  de  réunir  trente  sous-groupes 
de  la  nomenclature  sur  71  pour  former  un  ensemble  réu- 
nissant plus  de  82  p.  c.  du  personnel  total  et  de  la  popula- 
tion ouvrière;  en  s 'adressant  aux  industriels  les  plus  no- 
tables appartenant  à  ces  industries  on  réunirait  facilement 
des  données  intéressant  une  très  importante  fraction  de  la 
population  industrielle.  Mais  cette  méthode  ne  peut  s'ap- 
pliquer qu'à  des  enquêtes.  En  tant  qu'elle  porte  sur  des 
têtes  choisies,  elle  n'appartient  pas  au  relevé  direct,  lequel 
exige  des  investigations  s 'étendant  à  toutes  les  unités,  si 
minimes  qu'elles  soient.  Elle  présente  encore  un  autre  désa- 
vantage :  c'est  l'énorme  déchet  auquel  elle  donne  lieu  (1). 


(1)  En  187!),  pour  une  enquête  intitulée  «  Testimony  of  workingmen  »,  le 
Bureau  de  statistique  de  Boston  (Mass.  U.  S.  A.)  envoya  six  mille  question- 
naires à  des  ouvriers,  mais  l'enquête  échoua  tant  il  y  eut  peu  de  réponses. 
Une  enquête  sur  le  travail  dans  les  prisons,  organisée  sur  la  même  base,. 
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N'étant  aucunement  astreints  à  donner  une  réponse,  les 
industriels  en  grand  nombre  s'abstiennent,  par  négligence 
ou  pour  tout  autre  motif, de  faire  parvenir  leurs  réponses  au 
département  de  la  statistique.  Enfin,  les  réponses,  plus  ou 
moins  rares,  qui  parviennent  aux  organisateurs  de  l'en- 
quête sont  loin  d'offrir  des  garanties  suffisantes  d'exacti- 
tude et  de  sincérité. 

On  peut  recourir  à  un  autre  système  :  s'adresser  à  des 
personnes  choisies,  mais  au  lieu  de  leur  faire  parvenir  des 
questionnaires,  les  faire  visiter  par  des  enquêteurs  appar- 
tenant à  l'administration  ou  simplement  délégués  par  celle 
ci  (méthode  des  agents  spéciaux).  Ce  procédé  donne  d'excel- 
lents résultats,  mais  l'application  qu'on  peut  en  faire  est 
fort  limitée  :  d'abord  à  raison  des  frais  de  voyage  élevés 
qu'elle  entraîne,  ensuite  à  cause  des  délais  fort  longs 
qu'elle  impose;  les  agents  spéciaux  d'ordinaire  sont  fort 
peu  nombreux  et  il  faut  se  résigner  à  laisser  s'écouler  de 
longs  mois  avant  d'avoir  réuni  le  matériel  statistique  (1). 

Il  est  facile  de  voir  que  ces  méthodes  s'appliquent  à  des 
enquêtes  ou  relevés  partiels.  Par  leur  nature,  elles  ne  peu- 
vent convenir  au  relevé  direct  visant  toutes  les  unités  exis- 
tantes à  un  même  moment  dans  toute  l'étendue  d'un  pays. 
Dans  une  contrée  aussi  exiguë  que  la  Belgique,  on  compte 
250,000  entreprises  industrielles  en  activité  :  quel  moyen 
d'obtenir  250,000  réponses  volontaires  à  des  questionnaires 
transmis  par  la  poste,  ou  de  faire  visiter  à  domicile  un  pa- 
reil nombre  de  chefs  d'entreprise? 

90.  Le  relevé  direct  exige  la  nomination  de  véritables 
agents  recenseurs  chargés  de  recueillir  les  réponses  de  tous 


donna  quelque  résultat  après  seulement  que  le  Bureau  de  statistique  eut 
expédié  plus  de  trois  cents  lettres  de  rappel.  (Pidgin,  Practical  statistics, 
p.  7.  Boston,  1888.) 

(1)  Nous  sommes  entrés  dans  des  détails  plus  étendus  dans  notre  com- 
munication à  l'Institut  international  de  statistique  sur  la  «  méthodologie 
générale  delà  statistique  du  travail  »  {Bulletin  de  l'Institut  international  de 
statistique,  t.  14,  4e  livraison,  1905). 
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les  intéressés  ou  de  consigner  dans  les  formulaires  de  l'en- 
quête les  données  dont  ils, auraient  connaissance  à  raison  de 
leurs  fonctions.  Les  lignes  qui  précèdent  indiquent  som- 
mairement une  distinction  essentielle  entre  le  relevé  auto- 
matique et  le  relevé  réfléchi. 

Dans  le  relevé  automatique,  les  faits  sont  portés  à  la  con- 
naissance des  autorités,  sans  qu'aucune  démarche  spéciale 
soit  nécessaire  à  cet  effet.  Les  statistiques  des  naissances, 
des  décès,  des  mariages,  des  divorces  sont  constituées  par 
la  réunion  des  données  inscrites  aux  registres  de  l'état  civil  ; 
il  ne  faut  donc  pas  nommer  d 'agents  recenseurs  pour  s 'en- 
quérir des  faits,  mais  seulement  organiser  la  transcription 
des  documents  dressés  par  l'officier  de  l'état  civil.  En  Bel- 
gique, cette  transcription  se  fait  par  les  soins  des  adminis- 
trations communales  en  utilisant  des  tableaux  dressés  par 
le  département  ministériel  ayant  la  statistique  générale 
dans  ses  attributions  (1).  En  tant  que  chargés  de  la  trans- 
cription des  données  qui  sont  ensuite  travaillées  par  l'ad- 
ministration centrale,  les  agents  des  administrations  com- 
munales remplissent  une  fonction  qui  appartient  d'ordi- 
naire aux  agents  recenseurs,  mais  à  cela  —  et  c'est  un  point 
accessoire  —  se  borne  l'assimilation  qu'on  peut  établir 
entre  eux. 

Il  n'y  a  de  véritables  agents  recenseurs  que  dans  le  relevé 
direct. 

Ce  relevé  peut  s'étendre  à  toute  la  population,  comme  il 
peut  se  restreindre  à  toutes  les  manifestations  d'un  seul 
fait  économique,  politique,  financier.  Plus  les  faits  sont 
complexes,  plus  leurs  manifestations  sont  nombreuses,  plus 
aussi  augmente  la  difficulté  de  recruter  des  agents  capables 
et  attentifs.  Moins  favorisé  que  le  savant  qui,  dans  son  labo- 
ratoire, a  entre  lui  et  l'objet  étudié  un  seul  intermédiaire, 
le  microscope,  le  statisticien  professionnel  ne  voit  rien, 


(1)  «  Mouvement  de  l'état  civil  et  de  la  population  en  Belgique  pendant 
les  années  1876  à  1900  »,  par  C.  Jacquart.  Bulletin  de  la  Commission  Cen- 
trale de  statistique,  t.  XIX,  p.  208.  Bruxelles,  Hayez,  1906. 
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n'observe  rien  par  lui-même  :  des-  milliers  d'yeux  voient 
pour  lui,  des  milliers  d'intelligences  interprètent  sa  pensée, 
mais  ce  n'est  pas  —  bien  au  contraire  —  un  avantage  !  -Pour 
remédier  au  manque  d'unité,  il  faudra  prendre  de  multiples 
précautions.  Nous  en  avons  déjà  indiqué  quelques-unes  en 
parlant  du  bulletin  :  concision,  simplicité,  caractère  pré- 
cis des  questions.  Nous  résumons  ci-après  celles  qui  sont  de 
mise  à  l'égard  des  agents. 

91.  Selon  la  formule  donnée  par  Grabaglio,  les  agents  du 
relevé  réuniront  trois  conditions  :  A,  savoir,  B,  pouvoir, 
C,  vouloir;  le  tout  s 'appliquant  aux  données-  statistiques 
dont  il  s'agit  de  réunir  les  éléments. 

A.  —  Dans  la  première  condition,  nous  pouvons  distin- 
guer des  qualités  propres  à  l'agent,  et  d'autres  acquises  à 
la  suite  des  instructions  rédigées  par  la  direction  du  dénom- 
brement. L'agent  recenseur  doit  posséder  une  instruction 
générale  suffisante;  des  qualités  d'ordre,  de  conscience  et 
de  soin  sont  indispensables  pour  l'accomplissement  de  sa 
tâche.  A  une  connaissance  parfaite  de  la  langue  parlée  par 
les  recensés,  —  même  des  patois  locaux  —  il  joindra,  si  c'est 
possible,  une  connaissance  non  moins  étendue  de  l'en- 
droit où  il  a  à  remplir  sa  mission.  La  désignation,  en  qua- 
lité d'agents  recenseurs,  de  petits  fonctionnaires  de  l'Etat 
ou  des  communes,  donne  déjà  des  garanties  au  sujet  de  leur 
instruction  ;  leur  nomination  par  les  autorités  communales, 
sous  le  contrôle  du  gouvernement,  est  prescrite  en  vue  du 
choix  de  personnes  connaissant  parfaitement  la  localité. 
1\  est  recommandé  de  choisir  les  agents  recenseurs  parmi 
les  fonctionnaires  communaux,  les  instituteurs,  les  agents 
pensionnés.  Le  recensement  belge  de  l'industrie  et  du  com- 
merce de  1910,  prescrit  aux  administrations  communales 
de  désigner,  pour  effectuer  le  recensement,  des  agents 
instruits  et  capables,  choisis  autant  que  possible  parmi  les 
secrétaires  communaux,  les  instituteurs,  les  fonctionnaires 
retraités  ou  d'autres  personnes  exerçant  ou  ayant  exercé 
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des  fonctions  propres  à  faciliter  l'accomplissement  de  leur 
mission  (arrêté  royal  du  ,15  décembre  1910,  art.  17).  Dans 
les  grandes  villes,  à  cause  du  nombre  d'agents  recenseurs 
à  nommer,  ces  fonctions  sont  surtout  confiées  à  des  agents 
de  la  police.  On  a  émis  le  regret,  en  France,  que  dans  les 
grandes  villes,  le  nombre  des  agents  recenseurs  soit  tout  à 
fait  insuffisant  (1).  On  a  aussi  tenté  de  recruter  un  corps- 
volontaire  de  recenseurs,  à  qui  des  récompenses  honori- 
fiques seraient  accordées;  c'est  le  cas  en  Allemagne,  mais 
la  séduction  qu'exercent  les  emplois  officiels  n'est  pas  la 
même  dans  tous  les  pays.  S'il  est  permis  d'exprimer  une 
opinion  assez  paradoxale  au  sujet  de  la  capacité  intellec- 
tuelle à  exiger  des  agents  recenseurs,  nous  voudrions  dire 
que  les  plus  intelligents  ne  sont  pas  les  meilleurs.  Ce  sont 
les  plus  soigneux  et  les  plus  attentifs  qui  répondent  le 
mieux  à  ce  qu'on  en  attend.  Un  homme  très  intelligent 
jugera  peut-être  inutile  de  prendre  connaissance  avec  soin 
des  diverses  instructions  et  il  sera  tenté  de  substituer  ses 
vues  propres  à  celles  de  la  direction  ;  on  devra  compter  avec 
lui  sur  une  équation  personnelle  très  marquée.  A  l'occasion 
du  dernier  recensement  aux  Indes,  on  a  observé  que  les- 
bulletins  remplis  par  les  simples  agents  recenseurs  indi- 
gènes étaient  dressés  avec  plus  de  soin  que  les  réponses 
données  par  les  Européens.  Pour  ceux-ci,  le  recensement 
était  affaire  de  mince  importance  et  toute  réponse  était 
bonne  pour  en  finir  avec  une  formalité  aussi  ennuyeuse; 
l 'agent  recenseur  indigène,  au  contraire,  exerçant  une  fonc- 
tion publique,  l'a  remplie  en  conscience,  se  conformant  en 
tous  points  aux  directives  reçues. 

Il  appartient  à  la  direction  du  recensement  de  donner 
des  instructions  suffisantes  et  surtout  très  claires  aux 
agents  recenseurs.  Ce  point  mérite  quelque  développement 
et  pour  ne  pas  scinder  ce  qui  a  trait  aux  qualités  person- 
nelles des  agents,  nous  en  parlerons  plus  loin,  au  n°  92. 


(1)  Compte  rendu  du  recensement  de  1906,  p.  3,  note. 
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B.  —  L'agent  doit  pouvoir  exécuter  ce  qui  lui  est  com- 
mandé. Ceci  suppose  une  sage  discrétion  du  questionnaire. 
Ne  faites  pas  poser  par  le  recenseur  des  questions  indis- 
crètes, ou  heurtant  les  intérêts  ou  la  conscience  si  vous  vou- 
lez qu'il  réussisse  dans  sa  mission.  Sa  tâche,  non  plus,  ne 
doit  pas  être  trop  lourde.  Tous-  les  recensements  limitent 
le  nombre  de  bulletins  à  confier  à  un  seul  agent  recenseur. 
Le  maire,  en  France,  doit  désigner  des  recenseurs  à  raison 
de  1  par  100  habitants  dans  les  campagnes,  et  1  par  200  ha- 
bitants dans  les  villes;  les  agents  contrôleurs  sont  au  nom- 
bre de  1  par  2,000  habitants. 

C.  —  L'agent  doit  vouloir  arriver  à  un  résultat  exact.  On 
ne  lui  laissera  pas  émettre  d'appréciations  subjectives, 
de  crainte  des  divergences  de  vues  et  des  confusions.  La 
négligence  ou  l'indifférence  des  agents  est  un  écueil  fré- 
quent; l'organisation  d'un  contrôle  minutieux  avec  la  sanc- 
tion du  refus  de  l'indemnité  si  le  travail  est  mal  exécuté 
constitue  un  moyen  d'action  efficace.  Il  faut  rémunérer 
équitablement  les  agents  recenseurs,  si  l'on  veut  éviter  le 
dégoût  et  l'indifférence.  Dans  certains  pays,  cette  rémuné- 
ration est  à  charge  des  communes  ;  ailleurs,  elle  est  suppor- 
tée par  le  gouvernement,  comme  tous  les  autres  frais  du 
recensement. 

92.  Dans  les  instructions  aux  agents,  il  ne  s'agit  plus 
de  conceptions  abstraites,  mais  de  réalités.  Nous  plaçant 
résolument  devant  les  faits,  nous  nous  demanderons 
quelles  difficultés  rencontreront  les  agents  recenseurs,  s'ils 
trouveront  dans  les  instructions  les  moyens  de  les  surmon- 
ter et  de  quelle  façon  ils  comprendront  les  règles  tracées  à 
leur  usage.  S'il  nous  est  permis  d'invoquer  à  ce  propos 
notre  expérience  personnelle,  nous  dirons  que  dans  les  nom- 
breux cas  où  nous  avons  eu  à  rédiger  des  instructions  pour 
les  agents  d'une  enquête,  nous  avons  toujours  procédé  de 
la  sorte  :  a)  quelle  est  la  nature  des  difficultés  de  fait  que 
l'agent  est  exposé  à  rencontrer?  b)  les  difficultés  qui  nais- 
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sent  de  cette  situation  de  fait  sont-elles  expressément  pré- 
vues 1  c)  étant  donné  ce  qui  est  écrit  dans  les-  instructions, 
comment  pourrait-on  s'y  prendre  pour  le  mal  comprendre? 
—  car,  il  ne  suffit  pas  aux  instructions  d'être  claires,  elles 
doivent  ne  pas  pouvoir  être  détournées  de  leur  sens.  On 
trouve  des  gens  doués  d'un  véritable  génie  d'incompréhen- 
sion ou  de  détournement  du  sens  naturel  des-  mots.  Tous  les 
malentendus  ne  peuvent  être  évités  ;  raison  de  plus  pour  le 
rédacteur  des  instructions  de  faire  tout  le  possible  pour  en 
diminuer  le  nombre  ;  l 'épreuve,  que  nous  appellerons  néga- 
tive, des  instructions-  consistant  à  s'efforcer  de  les  inter- 
préter à  rebours,  est  un  exercice  excellent;  si  les  instruc- 
tions y  résistent,  elles  sont  bonnes. 

Pour  éviter  autant  que  possible  les  erreurs,  divers  procé- 
dés ont  été  recommandés  et  adoptés.  Les  commissions 
locales  et  provinciales  de  statistique,  qui,  à  l'imitation  de 
la  Belgique,  ont  été  créées  dans  plusieurs  pays,  ont  cessé  de 
fonctionner  ou  ont  été  expressément  abolies  pour  des  rai- 
sons qui  se  sont  imposées  partout  :  la  difficulté  de  trouver 
des  personnes  compétentes,  dans  les  petites  communes;  le 
fait  que,  pour  toutes  les  recherches  spéciales,  on  aura  plus 
d'avantage  à  consulter  des  fonctionnaires  attachés  au  ser- 
vice en  cause,  plutôt  qu'une  commission  composée  de 
membres  ayant  tous  la  même  compétence  générale.  Actuel- 
lement, on  s'efforce  de  faire  pénétrer  les  instructions  dans 
tous  les  rangs  des  agents  recenseurs  en  nommant  des  agents 
plus  qualifiés,  en  moins  grand  nombre,  dont  la  mission  est 
de  guider  les  agents  recenseurs  et  de  surveiller  leur  tra- 
vail. Le  bureau  central  organise  aussi  des  conférences  où 
les  différents  points  du  questionnaire  et  des  instructions 
sont  analysés  et  expliqués.  Les  conférences  donnent  de  bons 
résultats,  car  une  des  grandes  difficultés  consiste  à  obtenir 
que  les  agents  recenseurs  lisent  attentivement  leurs  instruc- 
tions-; le  commentaire  parlé  supplée  à  la  lecture  inattentive. 

Les  instructions  à  donner  aux  agents  recenseurs  com- 
portent deux  genres  de  renseignements  :  1°  l 'interprétation 
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des  termes  utilisés  dans  le  bulletin;  2"  l'ordre  des  opéra- 
tions et  la  date  à  laquelle  chacune  doit  être  commencée  et 
achevée. 

Voyons  quelles  sont,  en  France,  les  opérations  confiées 
aux  agents  recenseurs.  Leur  première  besogne  consiste  à 
établir  un  document  provisoire  appelé  «  carnet  de  prévi- 
sion »  servant  à  préparer  le  travail  de  recensement  et  à 
faire  connaître  le  nombre  de  bulletins  à  distribuer.  Quinze 
jours  environ  avant  la  date  fixée,  l'agent  recenseur  doit 
aller  de  maison  en  maison,  s'assurer  si  l'immeuble  est 
habité  ou  non,  indiquer  le  nombre  de  ménages  qui  y  logent 
et  le  nombre  de  membres  du  ménage.  La  profession  du 
chef  de  ménage  doit  être  indiquée  d'une  façon  très  pré- 
cise. Les  instructions  spécifient  ce  qu'il  faut  entendre  par 
maison,  ménage,  membres  et  chef  du  ménage.  Cette  be- 
sogne préparatoire  doit  être  terminée  au  plus  tard  le 
19  mars. 

Vient  ensuite  la  remise  des  bulletins  individuels  impri- 
més; elle  s'effectue  à  partir  du  22  mars  et  l'agent  doit  dé- 
poser dans  chaque  maison  un  nombre  de  bulletins  dépas- 
sant d'environ  un  quart  celui  qui  était  prévu  sur  le  carnet, 
afin  de  tenir  compte  des  hôtes  de  passage.  Les  instructions 
prévoient  ce  que  l'agent  a  à  faire  quand  il  s'agit  d'hôtels 
garnis,  de  maisons  où  il  existe  un  concierge,  d'établisse- 
ments dont  la  population  est  comptée  à  part  (lycées,  ca- 
sernes), etc.. 

La  reprise  des  bulletins  commence  deux  jours  plus 
tard.  Le  principe  essentiel  à  relever  ici,  c'est  que  l'agent 
doit  s'adresser  personnellement  aux  intéressés  pour  re- 
cueillir lui-même  les  renseignements  manquant  sur  les  bul- 
letins et  rectifier  les  réponses  insuffisantes  ou  inexactes. 
L'agent  recenseur  n'est  pas  un  facteur  des  postes  chargé  de 
distribuer  machinalement  des  imprimés  et  de  les  reprendre 
ensuite  sans  exercer  aucun  contrôle.  L'agent  doit  signer  le 
bulletin;  c'est  un  moyen  de  contrôle.  Malheureusement,  ii 
faut  bien  avouer  que  ce  contrôle  personnel  par  l'agent  re- 
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censeur  es-t  sans  doute  l'une  des  formalités  les  plus  impar- 
faitement exécutées  qui  sqient.  Si  les  agents  recenseurs  ap- 
pliquaient à  la  lettre  les  instructions  qui  leur  sont  données 
sur  ce  point,  la  qualité  des-  recensements  se  trouverait  du 
coup  améliorée  dans  une  large  mesure. 

Les  délais  impartis  aux  agents  recenseurs  pour  la  reprise 
des  bulletins  sont  de  trois  jours,  en  principe,  mais  on  peut 
aller  jusqu'au  huitième  jour,  dernier  délai,  en  cas  de  diffi- 
culté exceptionnelle.  Ces  délais  assurent,  dans  une  certaine 
mesure,  le  synchronisme  des  données  du  recensement,  mais 
pour  être  vraiment  efficaces  elles  devraient  être  plus  rigou- 
reuses. Nous  avons  déjà  dit  que  le  recensement  hindou,  en 
dépit  de  toutes  les  difficultés,  est  un  modèle  de  recensement 
synchronique. 


SECTION  II 


Le  relevé  indirect 


CHAPITRE  PREMIER 
Généralités,  définition,  divisions 

£.  —  Le  relevé  indirect  et  l'induction. 

93.  Les  auteurs  ont  appelé  relevé  indirect  celui  dans 
lequel  toutes  les  unités  ne  sont  pas  comprises,  mais  d'après 
les  résultats  duquel  on  tente,  par  induction,  de  parvenir  à 
la  connaissance  de  la  totalité  des  faits.  Si  nous  connaissons 
exactement  la  population  de  la  dixième  partie  d'une  région 
dans  laquelle  la  densité  de  la  population  est  constante  et 
égale,  nous  pouvons  nous  appuyer  sur  cette  donnée  incom- 
plète pour  calculer  la  population  totale.  Nous  ferons  tantôt 
la  critique  de  cette  conception  ;  en  attendant,  nous  prions  le 
lecteur  de  ne  pas  perdre  de  vue  les  conditions  de  l'hypo- 
thèse posée.  Le  relevé  indirect  est  une  simple  application 
des  procédés  inductifs;  il  consiste  à  appliquer  au  tout, 
moyennant  un  procédé  de  calcul  arithmétique,  ce  qui  a  été 
constaté  pour  la  partie  à  l'aide  d'un  relevé  direct  de  ses 
unités  ou  parties.  Du  connu,  le  statisticien  remonte  à  l'in- 
connu; il  suppose  exact  pour  le  reste  ce  qu'il  a  constaté 
pour  une  partie.  Entre  le  connu  et  l'inconnu,  il  existe  une 
relation  numérique  à  exprimer  au  moyen  d'un  coefficient. 
On  peut  admettre  un  coefficient  unique,  ou  différentiel. 
Dans  les  deux  cas,  le  caractère  du  relevé  ne  change  pas, 
c'est  toujours  une  application  de  l'induction. 
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Depuis  Moreau  de  Jonnès,  les  traités  de  statistique  ont 
relaté  les  calculs  de  Vauban  pour  connaître  la  production 
agricole  de  la  France,  ceux  de  Necker  qui  remplaçait  un 
recensement  de  la  population  par  l'établissement  d'un  coef- 
ficient de  natalité,  ceux  encore  de  Lavoisier  essayant  de 
déterminer  l'étendue  des  terres-  arables  au  moyen  du  nom- 
bre de  charrues. 

Sans  nous  attarder  à  reproduire  ici  ces  expériences  aux- 
quelles on  serait  parfois  tenté  de  donner  le  nom  de  bizarre- 
ries, examinons  uniquement  les  caractères  généraux  de  l'in- 
duction et  voyons  si  les  conditions  du  relevé  partiel  satis- 
font aux  exigences  théoriques. 

L'induction  suppose  l'observation  de  faits  positifs,  notés 
avec  leurs  caractères  de  fréquence,  de  grandeur,  d'espèce, 
faits  répétés  un  grand  nombre  de  fois  dans  des  conditions 
régulières  excluant  l'intervention  de  phénomènes  acciden- 
tels. 

La  seconde  phase  du  raisonnement  inductif  est  l'hypo- 
thèse :  la  répétition  des  mêmes  faits,  ou  ce  qui  revient  au 
même  la  répartition  régulière  des  espèces  d'un  seul  fait,  est 
l'indice  de  l'existence  d'une  loi  du  phénomène,  qu'il  est 
possible  de  vérifier  en  dehors  du  champ  actuel  d'observa- 
tion. 

A  l'hypothèse  succède  la  vérification  par  observation  ou 
par  expérience  ;  enfin,  vient  la  déduction. 

On  voit  très  vite  que  le  relevé  indirect  ne  répond  que  très 
imparfaitement  aux  conditions  théoriques  de  l'induction. 
En  premier  lieu,  nous  ne  pouvons  savoir  si  les  faits  obser- 
vés sur  une  étroite  partie  du  territoire,  ou  parmi  une  infime 
fraction  des  unités  existantes,  appartiennent  ou  non  à  la 
catégorie  des  faits  susceptibles  d'une  répétition  normale. 
On  voudra  bien  nous  épargner  l'objection  consistant  à  con- 
fondre la  nature  du  fait,  qui  n'est  pas  en  cause,  avec  sa 
mesure  statistique,  la  seule  chose  dont  il  s'agit  ici.  Certes, 
il  y  a  des  décès,  des  mariages,  des  naissances  partout  ;  il  y 
a  partout  des  salaires  relativement  élevés  et  des  salaires 


LE    RELEVÉ   INDIRECT  ;  GÉNÉRALITÉS 


153 


minimes.  La  question  n'est  pas  là;  elle  est  de  savoir  si  la 
répartition  des  salaires  est  la  même  dans  tout  le  pays  que 
dans  telle  province,  si  elle  est  identique  dans  les  industries 
non  enquêtées  et  dans  celles  qui  ont  fait  l'objet  d'une  étude, 
si  la  proportion  à  la  population  pour  les  mariages,  les  nais- 
sances et  les  décès  est  la  même  dans  tout  le  pays  que  dans 
telle  province  observée  à  l'aide  de  la  statistique.  Or,  a 
priori,  nous  pouvons  répondre  négativement  à  cette  ques- 
tion. Il  n'est  pas  vrai  que  cette  proportion  soit  applicable 
telle  quelle  à  d'autres  parties  que  la  partie  soumise  à  l'ob- 
servation. Nous  avons  vu  que  la  complexité  des  faits  crée 
des  combinaisons  innombrables  (Cfr.  Introduction,  ch.  III). 
Comment  ces  combinaisons  pourraient-elles  se  trouver  réa- 
lisées, dans  un  espace  étroit,  en  si  grand  nombre  qu'elles 
formeraient  une  image  typique  du  reste?  Plus  raisonnable 
apparaît  l'hypothèse  qu'à  chaque  condition  de  milieu,  de 
race,  de  climat,  de  culture,  d'industrie,  d'outillage,  de  mar- 
ché, correspond  un  «  jeu  »  particulier  de  combinaisons  et 
de  causes  dont  l'ensemble  donne  au  pays,  ou  à  de  vastes 
régions  du  pays,  le  caractère  qui  leur  est  propre.  Lorsque 
Lavoisier  établissait  le  rapport  entre  l'étendue  cultivée  de 
la  France  et  le  nombre  de  charrues,  a-t-il  pu  tenir  compte 
de  la  différence  des  cultures  et  du  sol,  des  habitudes  rurales 
comme  des  assolements,  de  l'étendue  du  mobilier  agricole 
comme  de  l'abondance  des  animaux  de  trait?  Il  eût  été  im- 
possible qu'il  le  fît,  et  surtout  qu'il  réussît  à  exprimer  de 
telles  constatations  en  un  simple  coefficient  ou  rapport. 

En  second  lieu,  ce  qui  manque  au  relevé  indirect  pour 
rentrer  dans  les  conditions  du  procédé  inductif,  c'est  la  véri- 
fication, véritable  nerf  de  l'induction.  Entre  l'observation 
et  la  déduction,  le  statisticien  passe  parfois  trop  rapide- 
ment sur  l'hypothèse  en  omettant  tout  à  fait  la  vérification. 
Le  procédé  inductif  se  base  sur  les  caractères  d'identité;  il 
manque  donc  de  sûreté  quand  il  s'applique  à  des  faits  qui, 
comme  le  dit  Gabaglio,  montrent  plus  de  différences  qu'ils 
n'ont  entre  eux  de  ressemblance,  qui  sont  susceptibles  d'in- 
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finies  variations  comme  le  sont  tous  les  faits  de  la  vie  so- 
ciale. 

IL  —  Divisions  du  relevé  indirect. 

94.  On  distingue  le  relevé  indirect  par  estimation  et  le 
relevé  indirect  proportionnalisê. 

Le  relevé  indirect,  surtout  par  estimation,  a  été  très  fré- 
quemment employé  avant  le  XIX8  siècle.  Un  grand  nombre 
de  statistiques  anciennes  sont  basées  sur  de  simples  évalua- 
tions et,  comme  on  nous  en  avertit  rarement,  nous  sommes 
parfois  tentés  d'attribuer  à  ces  chiffres  une  rigueur  qu'ils 
n'ont  pas  et  qu'ils  ne  peuvent  atteindre.  La  popula- 
tion des  villes  au  moyen-âge  a  été  souvent  établie  par 
des  procédés  peu  sûrs  assimilés  à  tort  à  ceux  en  usage  à 
l'époque  actuelle. 

Dans  le  relevé  par  estimation,  on  procède  : 

A.  —  Par  approximation.  Cette  méthode  se  base  sur  la 
connaissance  du  sujet  que  l'observateur  est  supposé  possé- 
der. Les  indications  fournies  constituent  des  renseigne- 
ments plus  ou  moins  imparfaits,  suffisants  pour  obtenir 
une  vue  d'ensemble  et  une  comparaison  en  général.  La  sta- 
tistique agricole  utilise  fréquemment  ce  procédé;  il  peut 
avoir  son  utilité  quand  il  s'agit  d'obtenir  très  vite  des  ren- 
seignements qui  ne  doivent  servir  qu'à  indiquer  une 
tendance. 

B.  —  Par  analogie.  Ce  procédé  consiste  en  une  étude  soi- 
gneuse des  conditions  numériques  d'un  certain  nombre  de 
faits  d'un  ordre  déterminé  et  dans  la  déduction  qu'on  en 
tire  à  l'égard  des  conditions  quantitatives  de  faits  d'un 
ordre  semblable. 

Dans  le  relevé  proportionnalisê,  on  procède  : 

A.  —  De  la  partie  au  tout.  Une  partie  seule  est  soumise  à 
l'observation.  Les  chiffres  trouvés  pour  cette  partie  sont 
ensuite  appliqués  à  la  totalité.  La  statistique  postale  est 
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basée  sur  deux  comptages  faits  pendant  une  durée  de  sept 
jours,  à  deux  époques  différentes  de  l'année;  la  moyenne 
de  ces  deux  relevés,  multipliée  par  52,  fournit  le  chiffre  des 
correspondances  pour  l'année  entière. 

B.  —  D'un  phénomène  à  l'autre.  La  condition  essentielle 
est  qu'il  existe  une  relation  étroite  entre  les  deux  ordres 
de  faits  considérés.  De  la  connaissance  précise  qu'on  a 
d'une  chose,  on  déduit  les  caractères  d'une  autre  chose. 
Ainsi,  on  a  toujours  connu  facilement  le  nombre  des  nais- 
sances et  des  mariages,  tandis  qu'on  a  été  longtemps  sans 
savoir  le  chiffre  de  la  population.  Lorsqu'on  a  pu  établir 
un  rapport  entre  ces  divers  éléments,  le  chiffre  de  la  popu- 
lation était  supposé  être  celui  qu'on  obtenait  en  multipliant 
le  nombre  des  naissances  par  le  coefficient  calculé  précé- 
demment. 

CHAPITRE  II. 
L'enquête  et  la  monographie 
I.  —  L'enquête. 

95.  Les  enquêtes  sont  des  recherches  offrant  un  caractère 
moins  général  que  les  travaux  statistiques  proprement  dits. 
Elles  ne  cherchent  pas  à  embrasser  toutes  les  unités  exis- 
tantes, à  les  mesurer  et  à  les  dénombrer  toutes.  C  'est  à  rai- 
son de  ce  caractère  que  l'enquête  appartient  au  relevé  indi- 
rect. 

On  distingue  les  enquêtes  privées  et  les  enquêtes  pu- 
bliques. 

Les  enquêtes  privées  rencontrent  de  nombreux  obstacles, 
car  les  moyens  d'investigation  dont  les  individus  isolés  dis- 
posent sont  d'ordinaire  fort  restreints.  Sauf  des  cas  excep- 
tionnels, pour  les  recherches  étendues-,  il  faut  nécessaire- 
ment l'organisation,  les  ressources  et  l'autorité  de  l'Etat. 

Les  enquêtes  publiques  sont  organisées  par  les  pouvoirs 
publics  ;  on  peut  en  distinguer  deux  types  principaux  : 
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1°  Les  enquêtes  parlementaires.  Elles  ne  sont  pas  exé- 
cutées par  les  assemblées  législatives,  évidemment  inaptes 
à  cette  mission,  mais- par  des  délégués  de  ces  assemblées,  ou 
simplement  à  leur  demande  et  d'après  un  programme  tracé 
par  elles.  Les  enquêtes  parlementaires  peuvent  être  libres 
ou  obligatoires;  dans  ce  dernier  cas,  les  témoins  cités  sont 
tenus  de  répondre  aux  questions  posées.  L'Angleterre  est 
le  pays  par  excellence  des  enquêtes  parlementaires  :  les 
questions  soulevées  par  la  réglementation  du  travail  en  ont 
nécessité  un  grand  nombre.  Aux  époques  de  crise  écono- 
mique, il  y  a  eu  dans  plusieurs  pays  des  enquêtes  sur  la  con- 
dition des  classes  ouvrières  ; 

2°  Les  enquêtes  statistiques.  Ce  sont  des  travaux  statis- 
tiques entrepris  par  des  administrations  spéciales  dans  le 
but  de  préciser  certains-  phénomènes  sociaux,  mais  sans  re- 
courir an  dénombrement  complet  de  toutes  les  unités,  ou 
n'envisageant  que  des  aspects  spéciaux  de  la  question. 

96.  En  quoi  l'enquête  diffère-t-elle  du  relevé?  C'est  une 
question  intéressante  sur  laquelle  on  a  passé  peut-être  un 
peu  rapidement.  Nous  essayerons  d'en  donner  un  aperçu 
systématique. 

La  matière  des  enquêtes  ne  semble  différer  en  rien  de 
celle  des  statistiques.  L'enquête  concerne  les  caractères  des 
sociétés  humaines,  leurs  aspects  généraux,  leurs  manifes- 
tations typiques,  leurs  tendances.  Elle  s'est  dirigée,  il  est 
vrai,  plutôt  vers  les  problèmes  économiques  que  vers  les 
questions  démographiques,  mais  il  n'y  a  pas  là  matière  à 
une  véritable  différenciation.  Il  est  tout  naturel  que  l'en- 
quête ait  été  l'instrument  de  recherches  préféré  dans  les 
investigations  sur  les  heures  de  travail,  les  salaires,  les  bud- 
gets ouvriers,  car  il  fallait  pouvoir  multiplier  les  coups  de 
sonde  et  l'on  ne  pouvait  guère  attendre  l'arrivée  des  grands 
recensements;  ceux-ci,  d'ailleurs,  avaient  leur  sphère  d'ac- 
tion nettement  circonscrite  dont  il  ne  pouvait  être  question 
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de  les  faire  dévier.  Kn  tant  que  matière,  statistiques  et  en- 
quêtes sont  donc  des  équivalents. 

Sous  le  rapport  de  la  forme,  nous  notons  une  première 
différence,  mais  les  avis  seront  partagés  sur  son  impor- 
tance. La  statistique  traduit  en  nombre  tous  ses  résultats  ; 
au  contraire,  on  connaît  deux  espèces  d'enquêtes,  les  unes 
ne  contiennent  que  des  chiffres,  additionnent  le  nombre  de 
réponses  affirmatives  et  négatives,  présentent  en  tableaux 
leurs  résultats,  — ■  d'autres  sont  d'expression  purement  lit- 
téraire  et  ce  ne  sont  pas  les  moins  instructives.  Pour  ceux 
qui  considèrent  la  notation  numérique  des  observations 
comme  un  caractère  secondaire  de  la  statistique,  la  diffé- 
renciation ci-dessus  ne  paraîtra  pas  bien  apparente,  mais 
dans  l'opinion  que  nous  avons  exprimée  plus  haut,  cette 
question  est  au  contraire  essentielle. 

Une  seconde  différence  se  marque  quand  on  aborde  le 
«  comment  »  de  l'enquête.  Si  les  questions  envisagées  par 
la  statistique  et  par  les  enquêtes  sont  les  mêmes,  elles  ne 
sont  pas  traitées  de  même.  Les  bulletins  des  statistiques 
sont  sobres,  concis,  peu  chargés  de  détails  ;  ils  peuvent  suf- 
fire à  donner  une  vue  d'ensemble  du  sujet,  à  en  marquer  les 
limites,  à  mesurer  les  grandeurs,  à  faire  apparaître  les  re- 
lations causales,  mais  on  a  renoncé  d'avance,  en  les  dres- 
sant, à  faire  l'inventaire  de  chacun  des  traits  particuliers 
des  unités.  Quelle  souplesse  et  quelle  variété,  au  contraire, 
dans  les  questionnaires  des  enquêtes  !  On  sent  que,  plus  à 
l'aise  parce  qu'il  opère  sur  des  groupes  moins  nombreux  et 
plus  faciles  à  manier,  l'auteur  de  l'enquête  a  pu  multiplier 
les  points  de  vue,  entrer  dans  des  détails  interdits  à  celui  qui 
s'adresse  à  des  centaines  de  milliers  de  personnes.  L'en- 
quête dispose  donc  d'un  questionnaire  plus  détaillé  et  plus 
riche  que  la  simple  statistique.  Toutefois  cette  différencia- 
tion n'est  pas  absolument  essentielle,  car  il  y  a  des  enquêtes 
fort  concises  et  des  statistiques  très  détaillées;  le  bulletin 
du  recensement  belge  des  industries  et  métiers  de  1896  for 
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mait,  par  exemple,  une  petite  brochure  d'une  vingtaine  de 
pages  ! 

Nous  touchons  au  nœud  de  la  question  lorsque  nous  exa- 
minons la  question  des  limites  imposées  à  l'un  et  à  l'autre 
genre  de  recherches.  Pour  exprimer  les  limites  du  relevé 
direct,  on  a  eu  recours  à  une  formule  extrêmement  large  : 
la  statistique  doit  étendre  ses  investigations  au  territoire 
entier,  sans  en  laisser  une  parcelle  inexplorée,  et  elle  doit 
comprendre  dans  ses  calculs  toutes  les  unités  existantes, 
sans  en  laisser  échapper  une  seule.  Or,  aucune  exigence  de 
ce  genre  n'est  formulée  pour  l'enquête  ;  les  limites  d'espace 
sont,  en  ce  qui  Ja  concerne,  larges  et  flottantes;  elles  s'éten- 
dent et  se  resserrent  au  gré  des  circonstances.  Dans  ces 
limites  mêmes,  il  n'est  pas  question  de  saisir  toutes  les  uni- 
tés, mais  seulement  d'en  relever  un  certain  nombre  prises 
comme  types.  La  statistique  détermine  les  dimensions  géné- 
rales des  phénomènes,  l'enquête  en  précise  les  contours. 

En  résumé,  l'enquête  est  un  procédé  différant  de  la  mé- 
thode statistique,  mais  par  son  but,  son  objet  et  son  aspect 
général,  elle  se  rapproche  tellement  du  relevé  statistique 
proprement  dit  qu'elle  en  forme  en  quelque  sorte  une  partie 
intégrante.  D'après  Salvioni,  enquête  et  statistique  sont 
des  divisions  coordonnées  de  l'investigation  des  phénomènes 
sociaux,  seulement  l'enquête  est  essentiellement  descriptive 
et  ne  vise  qu'à  donner  des  résultats  approximatifs,  alors 
que  la  statistique  s'efforce  de  faire  apparaître  les  dimen- 
sions des  faits  observés*  et  fournit  les  résultats  de  ses  re- 
cherches sous  la  forme  numérique. 

97.  L'enquête,  d'une  bien  plus  grande  souplesse  que  la 
statistique,  peut  viser  une  infinité  de  sujets.  Pour  s'en  faire 
une  idée,  le  lecteur  pourra  consulter  la  liste  des  publications 
des  différents  Offices  du  Travail  en  Europe  et  des  Bureaux 
de  statistique  du  Travail  aux  Etats-Unis  ;  des  exemples  en 
seront  analysés  avec  détail  dans  la  partie  de  cet  ouvrage 
consacrée  à  la  statistique  du  travail  (tome  III). 
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Nous  distinguons,  parmi  les  enquêtes,  plusieurs  types  ap- 
partenant à  des  classes  méthodologiques  différentes  : 

1°  L'enquête  orale  et  l'enquête  écrite.  Les  enquêtes  par- 
lementaires ou  publiques-  sont  généralement  des  enquêtes 
orales,  consistant  en  une  suite  de  questions  et  de  réponses 
suivant  les  indications  d'un  programme  général.  Les  docu- 
ments écrits  sont  généralement  rejetés  en  annexe  et  ne  pré- 
sentent qu  'une  importance  secondaire. 

Les  enquêtes  se  rapprochant  du  type  de  la  statistique 
sont  des  enquêtes  écrites  ; 

2°  L'enquête  par  questionnaires  répandus  dans  le  public 
à  un  grand  nombre  d'exemplaires,  chacun  étant  libre  d'y 
répondre  ou  non;  l'enquête  par  questionnaire  à  des  têtes 
choisies,  individus  ou  institutions  ;  celle  dont  les  documents 
sont  présentés  et  repris  par  des  agents  du  gouvernement; 
celle  enfin  où  la  documentation  est  recueillie  par  des  agents 
spéciaux,  visitant  les  endroits  désignés  et  rédigeant  les 
observations  sous  leur  propre  responsabilité? 

3°  L'enquête  dont  le  questionnaire  réclame  surtout  des 
renseignements  ayant  un  caractère  numérique  —  celle  dont 
le  questionnaire  comporte  des  réponses  d'expression  litté- 
raire —  celle  sans  questionnaire,  n'utilisant  qu'un  pro- 
gramme général  d'investigations  que  l'enquêteur  suit  du 
plus  près  possible. 

98.  Nous  reproduisons,  ci-après,  une  partie  d'un  question- 
naire d'enquête  à  caractère  statistique. 
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EEPUBLIQUE  FRANÇAISE  (1). 


Ministère  du  Travail 
et  de  la  Prévoyance  sociale. 


Paris,  le  3  janvier  1911. 


Statistique  générale 
de  la  France. 


Paris, 


97,   quai  d'Orsay. 


Monsieur  le  Président, 


Salaires, 
certaines 


catégories  d'ouvriers. 


durée  du  travail  de 


J'ai  l'honneur  de  vous  demander  de  bien  vouloir  remplir  et 
me  retourner  ensuite,  le  questionnaire  ci-contre,  relatif  aux 
salaires  ordinaires  de  quelques  catégories  d'ouvriers. 

Aux  catégories  désignées,  et  qui  ont  été  inscrites  pour  per- 
mettre des  comparaisons  avec  les  enquêtes  antérieures,  vous 
pourrez  utilement  ajouter  celles  qui,  dans  la  localité,  com- 
portent généralement  une  certaine  tarification  des  salaires. 

Je  vous  serai,  en  outre,  obligé  de  bien  vouloir  indiquer,  pour 
les  catégories  les  plus  nombreuses,  le  prix  habituel  de  pension 
payé  par  l'ouvrier  seul,  afin  de  permettre  de  comparer  le  coût 
de  la  vie  aux  différents  points  du  territoire  avec  les  chiffres 
qu'ont  fait  connaître  les  enquêtes  précédentes. 

Veuillez  agréer,  Monsieur  le  Président,  l'assurance  de  ma 
considération  la  plus  distinguée. 


Le  Ministre  du  Travail 


et  de  la  Prévoyance  sociale, 
L.  Laferre. 


A  Monsieur  le  Président  du  Conseil  de  prud'hommes. 


(1)  Extrait  de  Salaires  et  coût  de  l'existence  à  diverses  époques  jusqu'en 
1910,  publication  de  la  «  Statistique  générale  de  la  France  ».  Paris,  1911, 
pp.  15-17. 
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CATÉGORIES 
d'ouvriers 

N  o  m  b  r  e 
annuel  de 
journées 
de  travail 
pour  la 
majeure 
partie 
des  ou- 
vriers de 
chaque 
catégorie. 

Durée  la  plus 
habituelle 

de  la  journée 
de  travail 

Salaire 
ordinaire  de 
l'ouvrier 
non  nourri 

OB^EIÎVAÏIONS 
Indiquer, quand  il  y 
a  lieu,  le  salaire 
de  l'ouvrier  nour- 
ri ;  indiquer  s'il  est 
.  en  même  temps 
logé.  Dire  si  le  sa- 
laire de  l'ouvrier 
nourri  ou  logé  est 
paye  à  la  journée 
ou  au  mois. 

En 

été 

Eu 
hiver 

Par 
heure 

de 
travail 

Par 
journée 

de 
travail 

Ouvriers  : 

Ouvrier  agricole  .    .  . 
Garçon  jardinier .    .  . 
Garçon  boulanger  (bri- 

Meunier  

Garçon  boucher  (élalier 
au  détail)  .... 
Garçon  charcutier 
Ouvrier  brasseur.    .  . 
Imprimeur-compositeur 

Ouvrier  tanneur  .    .  . 
Sellier  bourrelier    .  . 
Cordonnier  .... 

Ouvrières  : 

Repasseuse  .... 
Couturière  en  robes.  ■  . 

Antrpç  çn^rïïilités 

nuiics  o y C \j  1  CL  1  1  IC 3 

importantes  dans  la 
région  : 

Quelles  sont  les  catégories  d'ouvriers  du  sexe  masculin  les  plus  nombreuses  dans 
la  région,  parmi  celles  désignées  ci-dessus  ? 

Quel  est  le  prix  de  pension  que  payent  le  plus  ordinairement  les  ouvriers  céliba- 
taires de  ces  catégories  pour  le  logement  et  la  nourriture? 
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99.  Une  organisation  des  enquêtes  beaucoup  moins 
étroite  que  la  précédente,  consiste  à  charger  du  travail  de 
recherche,  des  agents  spécialement  désignés,  appartenant  au 
personnel  administratif  ou  choisis  en  dehors,  en  leur  pres- 
crivant uniquement  de  suivre  les  indications  d'un  pro- 
gramme général  dressé  à  leur  intention.  L 'enquête  belge  sur 
les  industries  à  domicile,  commencée  en  1898,  qui  a  paru  en 
dix  volumes,  appartient  à  ce  type.  Nous  reproduisons  ci- 
après  le  début  du  programme  général;  on  le  trouvera  in 
extenso  dans  le  premier  volume  de  cette*publication  ;  à  rai- 
son de  sa  longueur,  il  est  impossible  de  le  donner  ici  en  en- 
tier : 

Généralités. 


Influence  des  conditions  physiques  sur  là  localisation  de  l'indus- 
trie. Topographie  générale,  le  sol,  l'air,  les  eaux. 


Le  milieu 
économique 


Le  milieu  social 
et  moral. 


Le  milieu 
physique. 

Le  milieu  démographique.  —  Population;  sa  densité. 

Caractère  industriel  de  la  région  :  grande,  moyenne,  petite 
industrie. 

Caractère  agricole  de  la  région  :  grande,  moyenne,  petite  culture 
Commerce  de  luxe,  commerce  d'objets  de  première  nécessité. 
Etat  de  perturbation  ou  de  tranquillité  sociale. 
Influence  de  la  coutume  et  de  la  tradition. 
Socialisme,  ses  moyens  d'action  et  de  propagande,  leur  succès 

auprès  des  ouvriers  de  l'industrie  à  domicile. 
Les  notions  inorales,  leur  influence  sur  la  population  travaillant 
à  domicile. 

I.  —  Organisation  commerciale. 

Origine        l  Transformation  de  la  condition  des  petits  patrons  indépendants, 
de  l'industrie     <      Régression  de  l'organisation  du  travail  en  fabrique  dans  le  but, 
à  domicile.      /      par  exemple,  de  réduire  les  Irais  généraux. 

Date  et  circonstances  de  l'établissement  de  l'industrie  dans  la  région. 
Phases  successives  de  son  développement  et  de  ses  transformations. 
Evolution  de  la  technique  et  de  l'outillage.  Description  sommaire  des 
procèdes  et  du  mode  de  travail  actuel. 

au  point  de  vue  de  la  quantité  produite; 
id.     de  la  bonne  exécution  du  travail; 
id.     de  l'apprentissage  et  du  recrutement  du 
personnel  ; 

id.     de  la  dispersion  et  de  l'agglomération  du 
personnel  ouvrier,  etc.,  etc. 


Evolution 
de 

l'industrie 

à 

domicile. 


Examen 
critique  des 

procédés 
et  du  mode 

actuels 
de  travail 
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Un  programme  de  ce  genre  est  une  sorte  de  table  des  ma- 
tières soumise  aux  enquêteurs  et  dont  ceux-ci  ont,  le  cas 
échéant,  à  remplir  certaines  divisions  tout  en  en  passant 
d'autres  sous  silence. 

100,  On  a  cherché  maintes  fois  à  établir  des  relations  sys- 
tématiques entre  le  relevé  partiel,  réalisé  au  moyen  de  l'en- 
quête et  le  relevé  complet  qu'on  pourrait  obtenir  par  un  re- 
censement. Le  problème  consiste  à  observer  des  parties  pro- 
portionnelles au  tout, comme  nombre, qualité, localisation, etc. 
Question  ardue  et  complexe,  supposant  toujours,  à  la 
base,  un  relevé  général  préalable  que  l'on  prend  pour  guide 
et  comme  moyen  de  vérification.  L'exposé  systématique  des 
enquêtes  représentatives  n'existe  pas;  cependant,  toutes  les 
institutions  dont  l'enquête  est  le  principal  moyen  d'investi- 
gation, ont  toujours  essayé  de  rendre  leurs  recherches  le  plus 
représentatives  possible.  Le  nombre  des  unités  comprises 
dans  l'enquête  n  'est  pas,  loin  de  là,  le  seul  élément  à  considé- 
rer ;  il  faut  encore  que  toutes  les-  classes  existantes  dans  la 
masse  se  trouvent  représentées  proportionnellement  et  que 
les  observations  soient  réparties  sur  toute  l'étendue  du  ter- 
ritoire. Des  essais  intéressants  ont  été  réalisés  en  Norvège, 
en  1894;  M.  Kicer,  directeur  du  bureau  central  de  statis- 
tique de  ce  pays,  en  a  donné  un  exposé  complet  dont  nous 
résumons  ci-après  quelques  points  principaux.  La  question 
qui  a  donné  lieu  à  l 'enquête  représentative  exécutée  en  Nor- 
vège, était  celle  de  la  création  d'une  caisse  générale  de  re- 
traite et  d'assurance  contre  l'invalidité  et  la  vieillesse.  Il  ne 
pouvait  être  question  de  recourir  à  un  dénombrement  géné- 
ral à  raison  du  peu  de  temps  dont  on  disposait  et  aussi  du 
nombre  considérable  des  questions  posées  par  le  question- 
naire (plus  de  soixante). 

Un  premier  élément  de  différenciation  est  la  distinction 
entre  les  villes  et  la  campagne.  Le  nombre  des  individus 
adultes  à  interroger  par  le  moyen  du  dénombrement  repré- 
sentatif étant  fixé  à  80,000,  on  répartit  ces  bulletins,  d'après 
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la  proportion  établie  par  le  précédent  recensement,  entre 
les  villes  et  les  campagnes^  soit  20,000  pour  les  villes  et 
60,000  pour  les  campagnes.  Un  second  élément  se  remarque 
aussitôt  :  les  grandes  villes,  les  villes  moyennes  et  les  pe- 
tites villes.  Il  a  fallu  désigner  les  localités  urbaines  dans 
lesquelles  s 'effectuerait  le  dénombrement  :  on  en  a  pris,  ré- 
parties entre  ces  trois  catégories,  treize  en  tout,  représen- 
tant environ  le  cinquième  des  villes  du  royaume. 

L'attribution  des  bulletins  réservés  aux  villes  (20,000), 
d'après  le  chiffre  de  leur  population,  aurait  eu  pour  consé- 
quence de  faire  remplir  un  trop  grand  nombre  de  bul- 
letins dans  les  grandes  villes  :  on  a  donc  donné  aux  villes 
moyennes  et  petites  un  nombre  de  bulletins  proportionnel- 
^ment  plus  élevé. 

Pour  la  répartition  des  bulletins  à  l'intérieur  de  la  plus 
grande  ville  du  royaume,  Kristiania,  on  a  suivi  un  système 
assez  curieux  :  les  rues  de  la  capitale  ont  été  classées  d'après 
leur  population,  puis  on  a  procédé  comme  suit  :  on  a  re- 
censé la  population  adulte  entière  de  1/20  des  rues  les  moins 
populeuses,  puis  celle  de  1/10  des  rues  de  la  seconde  caté- 
gorie, une  maison  sur  deux;  ensuite  celle  de  1/4  des  rues  de 
la  troisième  catégorie  en  prenant  une  maison  sur  cinq; 
enfin,  celle  de  la  1/2  des  rue&  les  plus  populeuses  mais  où 
seulement  une  maison  sur  dix  devait  être  visitée  par  les 
agents  de  l'enquête. 

L 'organisation  du  dénombrement  représentatif  s 'est  ins- 
pirée de  règles  analogues  dans  les  campagnes,  comme  on 
pourra  le  voir  en  recourant  au  mémoire  original  de 
M.  Kiœr.  D'après  les  chiffres  produits  par  le  statisticien 
norvégien,  le  rapport  des  diverses  classes  d'unités  com- 
prises dans  l'enquête  et  celui  des  mêmes  catégories  trou- 
vées à  l'aide  du  recensement  général  concordent  d'une  ma- 
nière fort  satisfaisante  (1). 


(1)  A.  N.  Kiœr,  «  Observations  et  expériences  concernant  des  dénom- 
brements représentatifs  ».  Bulletin  de  l'Institut  international  de  statistique, 
t.  IX,  2e  livraison,  p.  176. 
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II.  —  La  monographie. 

101.  Si  l'on  s'écarte  de  la  notion  de  la  statistique  avec 
l'enquête,  on  s'en  éloigne  bien  davantage  avec  la  monogra- 
phie. L'idée  de  phénomène  collectif  est  encore  présente  dans 
les  recherches  organisées  sous  la  forme  de  l'enquête;  celle- 
ci  est  une  statistique  moins  complète  que  le  relevé  direct, 
mais  les  faits  qu'elle  considère  sont  de  la  même  essence.  La 
monographie,  au  contraire,  s'attache  à  un  objet  qu'elle  dé- 
taille con  amore,  elle  en  analyse  toutes  les  parties,  elle  en 
scrute  les  derniers  replis.  Mais,  par  le  fait  même  qu'elle 
abandonne  la  recherche  collective  pour  se  vouer  à  l'obser- 
vation individuelle,  la  méthode  monographique  s'éloigne  du 
domaine  de  la  statistique.  On  n'a  pas  toujours  appliqué  à 
ces  notions  différentes  une  critique  assez  sévère,  ce  qui  fait 
qu'on  a  confondu  des  genres  que  la  logique  doit  séparer.  Le 
fait  seul  que  la  monographie  s'acharne  à  la  recherche  du 
«  type  »  n'est-il  pas  suffisant  à  la  faire  classer  en  dehors 
de  la  statistique,  laquelle  ne  concerne  que  les  phénomènes 
non  typiques?  Cheysson  a  déployé  beaucoup  de  diplomatie 
pour  faire  admettre  la  monographie  au  rang  d'une  sœur 
cadette  de  la  statistique.  Nous  ne  pouvons  cependant  être 
d'accord  avec  lui  que  le  relevé  direct  ou  statistique  propre- 
ment dit  jouerait  dans  l'ensemble  de  la  méthode  le  rôle  de 
la  synthèse,  et  que  celui  de  l'analyse  serait  réservé  à  la  mo- 
nographie. En  réalité,  la  statistique  se  limite  au  relevé  com- 
plet des  unités  et,  par  extension,  au  relevé  partiel,  par  voie 
d'enquête;  elle  ne  peut  consister  en  la  description  minu- 
tieuse d'un  seul  fait,  fût-il  qualifié  de  fait-type. 

Nous  résumons  ainsi  les  différences  essentielles  existant 
entre  la  méthode  statistique  proprement  dite  et  la  méthode 
monographique  : 

1°  La  statistique  est  une  méthode  propre  à  l'observation 
des  phénomènes  collectifs,  qui  étudie  les  faits  variables 
afin  d'arriver    à   la   notion   du   caractère   normal.  Il 
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en  résulte  qu'elle  considère  les  masses,  les  faits  collectifs 
dans  leur  ensemble.  La  monographie  ne  se  propose  pas  le 
même  but  et  loin  de  se  livrer  à  l'étude  des  masses  elle  se 
borne  avec  soin  à  l'examen  d'un  fait  soigneusement  déli- 
mité; 

2°  La  statistique  et  la  monographie  ne  parlent  pas  le 
même  langage.  Celui  de  la  statistique  est  essentiellement 
numérique.  Celui  de  la  monographie  est  littéraire  et  des- 
criptif ;  il  comprend  des  aperçus  historiques,  philoso- 
phiques, économiques,  sociologiques  et  les  chiffres  n'y  in- 
terviennent qu  'à  titre  de  documentation  ; 

3°  Les  méthodes  mathématiques  de  la  statistique,  em- 
ployées dans  le  but  de  dégager  les  résultats  généraux,  telles 
que  les  moyennes,  les  mesures  de  la  dispersion,  l'étude  des 
corrélations,  etc.,  ne  trouvent  pas  d'application  dans  les 
recherches  monographiques  pour  la  raison  qu'elles  sup- 
posent l'existence  d'un  très  grand  nombre  de  faits,  alors 
que  la  monographie  n'en  étudie  qu'un  seul  ou  qu'un  petit 
nombre. 

La  monographie  a  été  utilisée  par  Le  Play  pour  la  des- 
cription des  familles  et  complétée  par  l'établissement  du 
budget  de  dépenses  et  de  recettes.  On  a  appliqué  le  même 
procédé  descriptif  à  l'atelier  et  même  à  la  commune.  On 
peut  trouver  dans  ces  travaux  des  traits  de  ressemblance 
entre  les  deux  méthodes  statistique  et  monographique  ; 
ainsi,  le  domaine  qu'elles  explorent  l'une  et  l'autre  est 
presque  identique  ;  ce  sont  les  questions  se  rapportant  aux 
phénomènes  sociaux  et  économiques.  On  peut  traiter  les 
questions  de  la  natalité,  de  la  nuptialité,  des  salaires,  des 
accidents  du  travail  par  la  méthode  monographique  comme 
par  la  méthode  statistique.  Mais  l'identité  du  domaine 
exploré  n'implique  pas  l'identité  du  procédé  de  recherche. 
Une  autre  raison  invoquée  est  que  les  deux  méthodes  s'ef- 
forcent de  comparer  leurs  résultat»  dans  l'espace  et  dans 
le  temps  ;  il  nous  semble  que  ce  but  est  commun  à  toutes  les 
recherches  scientifiques  et  ne  suffit  pas  à  conclure  à  l'iden- 
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tité  (1).  Quelle  que  soit  la  valeur  des  œuvres  conçues  sur  ce 
type,  on  ne  peut,  pour  des  raisons  de  logique  et  de  méthode, 
les  comprendre  dans  le  domaine  de  la  statistique. 
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SECTION  III 
La  critique  statistique 


CHAPITRE  PREMIER 
Généralités,  définition,  division 
I.  —  Degré  de  précision  des  résultats  statistiques. 

103.  —  Supposons  achevées  les  opérations  du  relevé  :  les 
agents  recenseurs  sont  allés  de  maison  en  maison,  y  ont 
laissé  autant  de  bulletins  qu'il  le  fallait,  se  sont  présentés  à 
nouveau  pour  les  recueillir,  ont  vérifié  les  réponses  ins- 
crites au  bulletin,  les  ont  complétées  ou  les  ont  eux-mêmes 
rédigées,  si  les  recensés  en  étaient  empêchés.  Le  dénombre- 
ment a  été  exécuté  dans  toutes  les  communes,  ses  opérations 
répondent  à  la  condition  de  synchronisme  indispensable  en 
cette  matière,  les  questions  du  bulletin  ont  été  en  général 
bien  comprises,  les  administrations  subordonnées  ont  rem- 
pli avec  conscience  leurs  obligations,  bref  le  relevé  s'est 
effectué  —  admettons-le  —  dans  des  conditions  aussi  satis- 
faisantes qu'il  est  possible  de  le  souhaiter...  Est-ce  à  dire 
que  l'on  puisse  utiliser  immédiatement,  sans  retouches,  le 
matériel  tel  qu'il  vient  d'être  réuni? 

Avant  de  répondre  à  cette  question,  il  convient  d'exami- 
ner deux  problèmes  de  nature  générale  :  a)  celui  des  limites 
de  la  précision  en  matière  de  relevé  statistique  ;  b)  celui  du 
degré  de  centralisation  des  opérations. 
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A.  —  Dans  les  sciences,  la  précision  des  mesures  calcu- 
lées atteint  aujourd'hui  un  degré  extrêmement  élevé.  Les 
lunettes  et  les  télescopes  astronomiques,  par  exemple,  sont, 
comme  le  dit  M.  Edmond  Bouty,  les  plus  parfaits  des  in- 
struments de  précision.  «  Ils  dépassent  de  bien  loin  tous  les 
instruments  de  mesure  employés  dans  les-  laboratoires  de 
physique.  Ce  degré  d'exactitude  est  imposé  par  l'état  pré- 
sent de  l'astronomie.  Dans  bien  des  cas,  une  erreur  d'une 
seconde  d'arc  serait  considérée  comme  intolérable.  Les  me- 
sures courantes  sont  faites  au  dixième  de  seconde  d'arc, 
et  l'on  se  rendra  compte  de  ce  que  peut  être  une  telle  préci- 
sion, si  l'on  rappelle  que  l'arc  d'un  dixième  de  seconde  me- 
suré à  la  surface  de  la  terre  n'est  que  de  trois  mètres  en- 
viron (1)  »  . 

Cette  même  précision,  nous  la  rencontrons  jusque  dans 
les  sciences  appliquées  ;  il  n'est  pas  rare  de  voir  prendre  des 
mesures,  à  l'aide  d'un  vernier,  au  dixième  de  millimètre,  < 1 
il  n'est  pas  extraordinaire  de  voir  cette  précision  poussée 
jusqu'au  vingtième  de  millimètre.  De  simples  ouvriers  sont 
parfois  chargés  de  vérifications  portant  sur  des  dimensions 
aussi  imperceptibles. 

104.  Il  n'est  pas  question  dans  les  recherches  statis- 
tiques, d'arriver  à  une  précision  comparable  à  celle-là.  Nous 
en  sommes  loin  de  compte  et  pour  cause.  Que  l'on  songe 
d'abord  à  ce  que  le  relevé  comporte,  par  lui-même,  d'er- 
reurs, d'omissions  et  de  multiples  emplois;  ensuite,  à  la 
difficulté  des  définitions,  à  la  grossièreté  des  moyens  de 
compte,  à  l'indolence  de  ceux  qui  livrent  le  renseignement 
et  de  ceux  qui  le  recueillent,  et  l'on  sera  édifié.  Le  relevé  sta- 
tistique donne,  par  rapport  à  la  vérité  absolue,  une  simple 
approximation.  Pour  en  être  convaincu,  il  suffit  presque  de 
poser  les  termes  du  problème;  la  démonstration,  souvent, 
paraîtra  superflue. 

(1)  La  vérité  scientifique,  sa  poursuite,  par  Edm.  Bouty.  Paris,  Ern.  Flam- 
marion, 1908,  p.  172. 
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Voici  un  grand  port  de  mer,  dont  la  statistique  relève  le 
mouvement,  en  même  temps  qu'elle  indique  les  quantités 
de  marchandises  débarquées  et  embarquées  :  il  s'agit  d'An- 
vers. Nous  voyons,  entre  autres,  qu'en  1912,  on  y  a  débar- 
qué les  quantités  suivantes  de  marchandises:  peaux  brutes, 
57,970,501  kilogrammes;  os  et  cornillons,  35,168,958  kilo- 
grammes; guano,  12,861,589  kilogrammes.  Cette  précision, 
pour  impressionnante  qu'elle  soit,  ne  laisse  pas  de  nous 
causer  quelque  inquiétude.  Quelle  vraisemblance  y  a-t-il  que 
ces  marchandises  pondéreuses,  encombrantes  et  malpro- 
pres aient  été  minutieusement  pesées,  à  nulle  grammes 
près?  Dans  ces  conditions,  nous  aimerions  mieux  qu'on  s'en 
tînt  à  la  tonne,  c'est-à-dire  que  la  précision  fût  mille  fois 
moindre;  on  s'estimerait  encore  trop  heureux  d'avoir  des 
mesures  aussi  précises  et  peut-être  même  notre  sécurité 
serait-elle  plus  complète  si  on  se  bornait  à  une  approxima- 
tion encore  plus  grossière.  Les  statistiques  minières  qui 
font  connaître  le  chiffre  de  la  production,  y  mettent  plus  de 
discrétion;  elles  se  bornent  à  indiquer  le  nombre  de  tonnes 
extraites.  Personne  ne  croira  impossible  cependant  qu'un 
certain  nombre  de  berlaines  soient  comptées  en  trop  ou  en 
moins  et  qu'une  erreur  puisse  provenir  de  là,  comme  elle 
peut  avoir  pour  cause  une  approximation  par  trop  fruste 
des  quantités  déjà  extraites,  existant  en  stock.  Supposons 
qu'on  veuille  aller  plus  loin,  qu'on  ait  l'ambition  d'appli- 
quer au  relevé  des  mesures  plus  précises.  Il  faudrait  com- 
mencer à  mesurer  exactement  le  contenu  de  chaque  ber- 
laine,  chose  très  compliquée  si  nous  entendons  appliquer  les 
procédés  scientifiques  qui  sont  de  mise  en  matière  de  me- 
sure. Il  faudra  reconnaître  bientôt  que  de  tels  procédés  sont 
impossibles  à  appliquer  et  surtout  sont  tout  à  fait  inutiles, 
parce  que  la  quantité  totale  de  combustible  extrait  est  si 
considérable  qu'une  erreur  même  importante  en  elle-même» 
est  tout  à  fait  négligeable  par  rapport  à  la  masse.  Le  bon 
sens  doit  rester  notre  maître  en  toute  chose,  et  particuliè- 
rement en  statistique.  Une  erreur  d'un  gramme,  d'un  cen- 
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tigramme,  d'un  milligramme  et  moins,  pourra  être  tout  à 
fait  intolérable  en  chimie  et  avoir  des  conséquences  désas- 
treuses; une  erreur  de  mille,  de  dix  mille  ou  de  cent  mille 
kilos  est  fort  indifférente  en  bien  des  matières  dont  la  sta- 
tistique s'occupe.  Le  résultat  du  relevé  statistique  n'est  et 
ne  peut  être  qu'une  approximation. 

Cette  analyse  peut  paraître  un  peu  superflue;  il  n'en 
est  rien,  elle  doit  être  prolongée  encore  pour  dégager  défi- 
nitivement des  notions  claires  et  justes.  Dans  un  recense- 
ment de  la  population,  on  compte  le  nombre  de  personnes  se 
trouvant,  à  une  date  donnée,  à  un  endroit  déterminé  et  le 
nombre  de  personnes  qui  y  ont  légalement  leur  résidence. 
Il  est  permis  de  se  demander  si  ce  compte,  à  une  personne 
près,  a  des  chances  d'être  exact?  Il  y  a  deux  espèces  d'exac- 
titude; la  première  :  la  conformité  du  calcul  avec  le  docu- 
ment, ce  qu'on  veut  bien  admettre,  par  une  hypothèse  toute 
gratuite,  d'ailleurs...  il  est  certain  que  dans  le  comptage 
il  s'est  produit  des  erreurs.  La  seconde  espèce  d'exac- 
titude c'est  le  rapport  du  relevé  à  la  réalité.  Comment  sup- 
poser qu'aucune  omission  n'a  été  commise;  qu'aucun  bul- 
letin n'a  été  égaré;  qu'aucune  personne,  dans  les  grandes 
casernes  qui  servent  d'habitation  à  des  dizaines  de  mé- 
nages, n'a  omis  de  remplir  son  bulletin  et  que  l'agent  re- 
censeur s'est  aperçu  de  cette  lacune?  On  peut  en  dire  tout 
autant  du  recensement  industriel  qui  relève  le  nombre  d 'en- 
treprises, de  patrons,  d'ouvriers,  de  moteurs,  etc.  Et  là,  un 
danger  plus  grave  menace  l'exactitude  du  relevé  :  c'est 
l'omission  d'une  unité  importante  et  la  répétition  de  la 
même  unité  déclarée  par  plusieurs  personnes  ayant  un  titre 
quelconque  à  faire  cette  déclaration.  En  Belgique,  lors  du 
recensement  industriel  de  1896,  une  fabrique  comprenant 
plusieurs  milliers  d'ouvriers,  fut  recensée  trois  ou  quatre 
fois,  en  même  temps,  par  suite  de&  déclarations  émanées  du 
directeur,  de  l'ingénieur,  de  l'administrateur  délégué,  etc. 
Hâtons-nous  d'ajouter  que  la  critique  instituée  eut  pour 
résultat  d'empêcher  ce  comptage  multiple. 
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Qu'il  s'agisse  d'un  comptage  de  choses  ou  d'un  relevé  de 
personnes,  la  statistique  ne  peut  donner  de  certitude  abso- 
lue si  l'on  recherche  un  degré  de  précision  tant  soit  peu 
élevé.  C'est  du  reste  d'une  parfaite  inutilité  dans  un  grand 
nombre  de  cas. 

105.  Cette  conclusion  ne  peut  manquer  de  provoquer  une 
objection,  sinon  dans  l'esprit  du  lecteur,  du  moins  parmi 
les  sectateurs  d'une  sagesse  vulgaire  et  un  peu  épaisse  : 
«  Si  la  statistique,  diront-ils,  ne  peut  donner  que  des  ap- 
proximations, est-il  bien  nécessaire  de  s'acharner  à  la  ren- 
dre plus  exacte  ou  plus  précise  qu'elle  n'est  quand  elle 
arrive  en  nos  mains?  A  quoi  bon  substituer  une  erreur  un 
peu  moins  grande  à  une  erreur  un  peu  plus  forte!  Est-on 
bien  certain  que  la  seconde  mesure  sera  plus  exacte  que  la 
première?  »  Admettre  un  tel  postulat  équivaudrait,  en  réa- 
lité, à  condamner  tout  le  mouvement  scientifique  contempo- 
rain. De  ce  que  les  anciens  instruments  astronomiques  ne 
donnaient  qu'une  approximation  assez  grossière,  à  cause 
de  leur  faiblesse  et  de  la  réfraction  provoquée  par  leurs  len- 
tilles, fallait-il  conclure  à  l'inutilité  de  recherches  nou- 
velles? Les  calculs  basés  sur  ces  mesures  insuffisantes 
étaient-ils  absolument  inutiles?  Penser  que  la  statistique 
peut,  sans  inconvénient,  se  contenter  de  prendre  tel  quel  le 
matériel  qui  lui  est  apporté  par  l'observation  primaire, 
c'est  la  condamner,  de  dégradation  en  dégradation,  à  un 
empirisme  vide  de  toute  pensée  scientifique.  L'énoncé  de 
pareille  conséquence  dispense  d'une  réfutation  plus  étendue. 

II.  ■—  Influence  de  la  centralisation  sur  l'exactitude  des  résultats. 

106.  Le  lecteur  se  rappelle  notre  division  du  relevé  statis- 
tique: relevé  direct  ou  complet,  relevé  indirect  ou  partiel. 
Pour  plus  de  clarté,  envisageons  seulement  le  relevé  direct, 
celui  auquel  on  peut,  à  juste  titre,  donner  le  nom  de  relevé 
statistique.  Les  bulletins  se  trouvant  remplis,  il  faut  les  dé- 
pouiller et  en  faire  la  critique.  Mais  entre  les  deux  opéra- 
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tion  :  le  relevé  d 'un  côté,  la  critique  et  le  dépouillement  de 
l'autre  il  existe  un  hiatus  que  le  lecteur  aura  déjà  aperçu  : 
comment  s 'opèrent  la  réunion,  le  classement  et  la  transmis- 
sion à  l 'organe  central  des  centaines  de  milliers  de  bulletins 
recueillis  sur  tous  les  points  du  territoire? 

Divers  systèmes  sont  en  présence  ;  le  choix  à  faire  n  'est  pas 
indifférent  sous  le  rapport  de  la  possibilité  de  l'application 
des  règles  critiques.  Le  plus  ancien  pourrait  être  appelé  : 
système  de  la  décentralisation.  Dans  l'organisation  du  dé- 
pouillement on  a  pris  soin,  dans  ce  cas,  de  décharger  autant 
que  possible  l'organe  central  de  toute  besogne  d'exécution 
pour  ne  lui  laisser  à  accomplir  qu'un  travail  de  coordina- 
tion. La  description  de  cette  organisation,  ainsi  que  de  celle 
dite  de  la  «  centralisation  »  trouvera  sa  place  à  l'endroit 
où  il  est  traité  du  dépouillement.  Nous  n'avons,  pour  le  mo- 
ment, qu'à  la  considérer  sous-  le  rapport  des  facilités  ou  des 
obstacles  qu'elle  présente  pour  la  critique  statistique. 

A  cet  égard,  la  valeur  d'une  statistique  exécutée  dans  ces 
conditions  nous  semble  très  faible,  pour  ne  pas  dire  davan- 
tage. 

La  critique  ne  se  trouve  organisée  nulle  part.  Si  elle  peut 
se  faire  lors  d'une  phase  quelconque  du  travail,  ce  ne  peut 
être  que  lors  du  second  passage  de  l'agent  recenseur,  lors- 
qu'il vient  recueillir  les  réponses  des  recensés.  Il  lui  est 
prescrit  de  s'assurer  alors  de  l'exactitude  des  mentions 
portées  au  bulletin,  mais  dans  quel  sens  entend-on  ce  terme 
«  exactitude  »  ?  Prenons  comme  exemple  un  recensement  de 
ce  type,  d'ailleurs  parfaitement  organisé,  si  l'on  admet  la 
justesse  du  point  de  départ,  et  voyons  ce  que  les  instructions 
aux  agents  recenseurs  contiennent  de  règles  positives  re- 
latives à  la  critique  du  document.  La  vérification  dont  il 
s'agit  prend  un  caractère  administratif,  dès  la  définition 
qui  en  est  donnée  :  «  le  soin  de  veiller  à  ce  que  tous  les  ren- 
seignements consignés  dans  chaque  bulletin  le  soient  con- 
formément aux  prescriptions  du  gouvernement  est  l'acte  le 
plus  important  dont  l'agent  recenseur  ait  à  s'acquitter  dans 
l 'exercice  de  ses  fonctions.  » 
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Ce  contrôle  revêt  ainsi  un  caractère  assez  formaliste. 
L'agent  recenseur  est  invité,  il  est  vrai,  à  s'assurer  si  toutes 
les  personnes  qui  doivent  figurer  au  bulletin  s'y  trouvent 
mentionnées,  si  l'on  n'y  a  point  inscrit  des  personnes  qui  ne 
devraient  pas  être  comprises  dans  un  document  de  ce 
genre,  etc.  Les  instructions  passent  ensuite  en  revue  une 
série  «le  cas  :  que  fera  l'agent  recenseur  dans  telle  circon- 
stance '!  Comment  doit-il  agir  dans  telle  autre?  Il  est  dit  que 
ia  mention  de  tout  pseudonyme  ou  sobriquet  est  interdite, 
que  tous  les  prénoms  doivent  être  énoncés  si  c'est  possible 
dans  l'ordre  qui  leur  est  assigné  dans  l'acte  de  naissance; 
nous  voyons  aussi  que  les  jeunes  enfants,  qui  ne  sont  pas 
encore  en  âge  de  parler,  sont  inscrits  sur  le  bulletin  comme 
ne  parlant  «  aucune  langue  »,  tandis  que  les  muets  sont 
censés  parler  la  langue  ou  les  langues  nationales  dont  ils  se 
servent  habituellement  pour  exprimer  leurs  idées.  Mais 
toutes  ces  règles,  pour  bien  fondées  qu'elles  soient,  ne  con- 
stituent pas  la  critique  du  document.  Nous  pensons  y  arri- 
ver en  entamant  le  chapitre  important  des  ((  professions, 
fonctions  ou  positions  ».  Notre  attente  est  déçue,  car  à  pro- 
pos de  la  question  si  difficile  des  distinctions  économiques 
entre  patrons,  employés  et  ouvriers,  nous  ne  trouvons  que 
cette  brève  mention  :  «  le  recensé  qui  exerce  une  profession 
industrielle,  commerciale  ou  agricole,  mentionnera  s'il 
l'exerce  comme  maître,  patron  ou  chef  d'exploitation, 
comme  employé  ou  surveillant,  comme  ouvrier  ou  ma- 
nœuvre. » 

«  Les  qualifications  souvent  usitées  de  journalier,  ou- 
vrier, manœuvre,  ne  doivent  être  employées  qu'en  spéci- 
fiant, en  même  temps,  le  genre  de  métier  exercé  par  l'inté 
ressé.  Exemples  :  journalier  agricole,  ouvrier  terrassier, 
manœuvre  de  maçon,  manœuvre  de  houillère,  etc.  (1)  » 

En  dehors  de  ce  moment,  d'après  la  reprise  des  bulletins, 


(1)  Belgique  :  Recensement  général  de  la  population  au  31  décembre  1910. 
Ûamet  d'instructions,  eh.  III,  1. 
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l'agent  recenseur  n'aura  plus  l'occasion  de  contrôler  quoi 
que  ce  soit  :  absorbé  par  des  besognes  administratives,  il 
emploie  son  temps  à  remplir  des  formules,  à  aligner  des 
chiffres,  mais  il  se  trouve  dans  l'impossibilité  de  vérifier 
les  déclarations  faites  par  les  recensés.  L'organe  central 
en  est  plus  empêché  encore,  puisqu'il  n'est  en  possession 
d'aucun  document  original,  mais  seulement  de  tableaux  ré- 
capitulatifs numériques.  Sans  doute,  si  l'une  ou  l'autre  er- 
reur énorme  est  commise  dans  ces  dépouillements  prélimi- 
naires, l'organe  central  pourra  s'en  apercevoir.  Mais  il  ne 
pourra  jamais  rectifier  les  fausses  déclarations  en  vertu 
desquelles,  par  exemple,  des  patrons  se  sont  inscrits  comme 
ouvriers,  ou  vice-versa.  Sans  le  document  original  mûre- 
ment examiné,  pesé,  tourné  et  retourné,  il  n'y  a  pas  de  cri- 
tique possible.  La  centralisation  des  opérations  consécu- 
tives du  relevé  est  donc  la  condition  d'une  critique  efficace. 
A  supposer  même  qu'on  puisse  en  confier  la  critique  à  des 
agents  recenseurs  d'une  qualité  très  supérieure  à  ce  qui  est 
habituel,  le  nombre  même  de  ces  agents  rendrait  difficile  un 
pareil  travail:  les  règles  tracées  n'auraient  guère  chance 
d'être  appliquées  d'une  façon  uniforme.  Il  faut  donc,  non 
seulement,  travailler  sur  le  document  original,  mais,  de 
plus,  c'est  au  centre  que  la  vérification  doit  s'opérer. 

JII.  —  Nécessité  de  la  critique  statistique, 

107.  Le  développement  de  la  critique  a  toujours  marché 
de  pair  avec  celui  de  l'esprit  scientifique.  Le  jour  où  le  pre- 
mier savant  a  soumis  à  une  enquête  méthodique  les  éléments 
de  ses  connaissances,  la  critique  est  née  et,  avec  elle,  l'esprit 
scientifique.  La  statistique  n'a  pas  fait  exception  à  la  règle. 
Ce  serait  une  recherche  de  pure  érudition  d'essayer  de  trou- 
ver quel  est  celui,  parmi  les  nombreux  professeurs  de  sta- 
tistique et  auteurs  de  manuels,  qui  eut  le  premier  l'idée  de 
la  valeur  de  la  critique.  Eemarquons-le  en  passant  :  cette 
idée  est  très  nettement  exprimée  dans  les  écrits  de  celui  qui, 
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précisément,  a  imprimé  à  la  statistique  un  caratère  scienti- 
fique ;  Quetelet,  dans  ses  ((  Lettres  sur  la  théorie  des  proba- 
bilités »  y  a  consacré  un  paragraphe  (1).  La  critique  est 
d'autant  plus  nécessaire  dans  notre  domaine  que  les  chif- 
fres impressionnent  davantage  le  lecteur  confiant.  Dans  un 
volume  de  format  imposant,  de  sévères  colonnes  de  chiffres 
donnent  l'impression  de  recherches  minutieuses,  de  résul- 
tats- précis,  de  conclusions  nettes,  certaines.  Le  chiffre  est 
fascinateur,  comme  l'a  très  bien  montré  Seignobos  (2).  Et 
il  faut  un  véritable  effort,  parfois,  pour  s'arracher  à  la 
séduction  qu  'il  exerce,  à  l 'impression  de  sécurité  qui  émane 
de  lui.  En  histoire,  en  philosophie,  nous  savons  bien  que 
nous  sommes  exposés  à  subir  l'influence  de  l'auteur;  mais 
dans  l'exposé  qu'il  nous  fait,  si  nous  avons  quelque  peu  l'es- 
prit critique,  nous  démêlons  bien  vite  ses  tendances,  sa  façon 
de  travailler,  ses  préoccupations  secrètes,  ses  convictions 
religieuses  et  philosophiques,  et  contre  tout  cela  nous  nous 
tenons  en  garde. 

108.  En  statistique,  rien  de  pareil.  La  personnalité  de 
l'auteur  n'apparaît  pas.  Elle  est  muette  et  sans  accent  et 
cependant  cette  personnalité,  non  seulement  existe,  mais 
elle  existe  à  des  milliers  d'exemplaires.  Il  n'y  a  pas  que 
celle  de  l'éditeur  de  l'ouvrage,  il  y  a  les  personnalités  mul- 
tiformes de  tous  ceux  qui  ont  répondu  au  bulletin. 
Quand  l'historien  analyse  un  document,  il  l'examine  sous 
tous  les  points  de  vue,  il  le  lit  et  le  relit,  il  scrute  les 
mobiles,  il  analyse  les  passions,  il  en  recherche  les  ma- 
nifestations dans  l'expression  littéraire  adoptée  par  l'au- 
teur du  document.  Il  étudie  ainsi  un,  dix,  cent  documents. 
Le  statisticien  en  a  des  centaines  de  milliers  devant  lui  qui, 
eux  aussi,  méritent  une  analyse.  N'exagérons  rien;  ce  sont 


(1)  Quetelet,  Lettres  sur  la  théorie  des  probabilités.  Bruxelles,  Hayez, 
1846,  p.  298. 

(2)  Seignobos,  La  méthode  historique  appliquée  aux  sciences  sociales. 
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des  documents  d'une  nature  plus  simple,  moins  étendus  que 
les  documents  historiques'  proprement  dits.  Et  puis,  la  plus 
simple  technique  a  enseigné  le  moyen  de  surprendre,  en  fla- 
grant délit,  le  menteur  intentionnel.  La  besogne  est  moins 
ardue,  mais  elle  est  nécessaire  en  statistique  comme  en  his- 
toire, car  un  bulletin  statistique  est  un  document  et  qui  dit 
document  dit  un  écrit,  un  témoignage,  où  viennent  se  reflé- 
ter les  passions  qui  agitent  les  hommes. 

La  fonction  de  la  critique  statistique  consiste  donc  tout 
d'abord  à  éliminer  des  réponses  les  éléments  douteux  intro- 
duits par  l'intérêt,  la  défiance,  ou  simplement  la  paresse. 
Puis,  se  souvenant  qu'une  organisation  compliquée  ne  peut 
fonctionner  sans  quelques  accrocs,  le  statisticien  s'effor- 
cera de  corriger  les  erreurs  matérielles  provenant  des  omis 
sions  et  des  doubles  emplois  dans  le  relevé,  des  fautes  com- 
mises dans  le  comptage,  et  d'effacer  jusqu'aux  erreurs  ma- 
térielles de  calcul,  d'écriture  et  d'impression. 

De  là,  une  division  toute  naturelle  de  la  matière  :  la  cri- 
tique de  sincérité  qui  s'applique  aux  éléments  intentionnels  ; 
la  critique  d'exactitude  qui  vise  les  cas  d'erreur  ayant  une 
origine  accidentelle. 

109.  Les  erreurs  que  constate  la  critique  sont  :  1"  con- 
stantes, ou  2"  accidentelles.  Les  premières  sont  celles  qui  se 
reproduisent  autant  de  fois  que  l'observation  est  répétée  et 
demeurent  les  mêmes  lorsque  les  circonstances  de  l'obser- 
vation restent  identiques.  Les  défauts  d'organisation 
du  relevé,  les  dispositions  psychologiques  de  l'observa- 
teur ou  du  sujet,  des  instructions  peu  claires  créent  des 
erreurs  constantes. 

Les  erreurs  accidentelles  (ou  irrégulières)  sont  celles  pro- 
duites par  une  quantité  de  petites  causes  qui  troublent  l'ob- 
servation tantôt  sur  un  point,  tantôt  sur  un  autre  et  qui,  à 
cause  de  leur  complexité,  ne  peuvent  être  connues  à 
l'avance.  Une  bonne  organisation  statistique  ne  peut  les 
empêcher  toutes,  mais  en  réduit  le  nombre  ;  elles  se  distri- 
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buent  selon  une  certaine  loi  et  sont  d'autant  moins  opé- 
rantes que  le  nombre  des  observations  est  élevé. 

Les  erreurs  constantes  sont  parfois  «  intentionnelles  »  à 
raison  des  dispositions  psychologiques  de  l'auteur  du  docu- 
ment :  telle  est  la  tendance  à  déclarer,  lors  des  recense- 
ments, un  âge  arrondi  à  la  décimale  la  plus  proche. 

Cette  distinction  correspond  à  celle  que  l'école  anglaise 
désigne  du  nom  de  «  Biassed  »  et  «  Unbiassed  errors  )),  dis- 
tinction à  laquelle  les  écrivains  de  cette  école  attachent  une 
grande  importance.  Pour  mieux  faire  saisir  la  différence 
entre  les  unes  et  les  autres,  M.  Bowley  choisit  l'exemple  sui- 
vant :  imaginez  que  l'on  fasse  une  enquête  sur  les  salaires 
avec  la  pensée  de  montrer  que  les  salaires  sont  élevés  et  que 
l'on  emploie  des  enquêteurs  ayant  accepté  de  se  conformer  à 
cette  tendance.  Les  enquêteurs  se  rendront  dans  différentes 
localités  industrielles  et  s'informeront  des  salaires  des  ou- 
vriers les  plus  qualifiés  et  les  plus  réguliers  ;  de  cette  façon 
les  chiffres  produits  seront  trop  élevés  par  rapport  à  la  si- 
tuation moyenne.  Si  dans  une  autre  enquête  portant  sur  le 
même  objet,  la  direction  se  laisse  guider  uniquement  par 
une  pensée  scientifique  et  veut  faire  une  enquête  impartiale, 
les  enquêteurs  pourront,  il  est  vrai,  choisir  des  situations 
qui  sont  tantôt  supérieures,  tantôt  inférieures  à  la  moyenne, 
mais  le  cas  est  tout  différent  du  premier. 

Dans  le  premier  cas,  il  y  aura  des  erreurs  constantes 
(biassed  errors),  toutes  dans  la  même  direction,  tendant 
toutes  à  augmenter  la  moyenne  ;  dans  le  second  cas,  les  er- 
reurs seront  accidentelles  (unbiassed  errors)  et  plus  grand 
sera  le  nombre  des  estimations,  plus  petite  sera  l'erreur 
résultant  des  appréciations  fautives, 

La  différence  essentielle  entre  les  erreurs  constantes  et 
les  erreurs  accidentelles  consiste,  en  ce  qui  concerne  ces 
dernières,  en  ce  que  les  erreurs  se  balancent  et  s'annihilent 
à  peu  près,  tandis  que  dans  le  cas  des  premières  les  erreurs 
se  maintiennent  au  même  niveau  et  s'ajoutent  les  unes  aux 
autres.  Si  l'on  procède  à  plusieurs  observations  (ri)  qui 
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donnent  toutes  la  même  erreur  x,  on  a  comme  résultat  final 
la  moyenne 
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grandeur  égale  à  l'erreur  constatée  dans  chaque  observa- 
tion. 

110.  Les  erreurs  commises  au  cours  du  relevé  sont  donc  : 
d)  intentionnelles;  b)  fortuites.  Dans  le  premier  cas, 
le  renseignement  donné  a  été  volontairement  altéré,  soit 
par  celui  qui  l'a  fourni,  soit  par  celui  qui  l'a  recueilli.  Les 
mobiles  qui  ont  déterminé  à  ne  pas  répondre  conformément 
à  la  vérité  varient;  on  les  fixe  par  l'analyse  psycholo- 
gique. Dans  le  second  cas,  l'intention  de  tromper  n'apparaît 
pas;  des  raisons  diverses  expliquent  le  mécanisme  de  l'er- 
reur :  insouciance,  questions  mal  comprises,  erreur 
matérielle,  etc.  Ces  causes  sont  connues  par  l'analyse 
des  faits  et  des  circonstances.  Les  erreurs  intentionnelles 
sont  synthétisées  par  cette  formule  :  «  On  a  voulu  nous 
tromper  »,  les  erreurs  fortuites,  par  cette  autre  :  «  On  s'est 
trompé  ».  De  là,  dans  la  critique  statistique,  deux  divisions 
bien  tranchées  :  1°  la  critique  de  sincérité,  au  moyen  de  la- 
quelle on  fait  apparaître  les  causes  d 'insincérité;  2°  la  cri- 
tique d'exactitude,  dont  le  but  est  de  découvrir  les  erreurs 
fortuites.  Ces  deux  parties  envisagent  respectivement  les 
erreurs  constantes  et  accidentelles  dont  l'importance  rela- 
tive, très  différente,  a  été  définie  plus  haut. 

CHAPITRE  II 
Critique  de  sincérité 
Mobiles  psychologiques  influençant  la  sincérité  statistique. 

111.  Le  présent  paragraphe  se  rapporte  exclusivement 
à  la  critique  de  sincérité,  ou,  dans  un  sens  plus  étendu,  à  la 
recherche  des  erreurs  constantes.  Il  n'y  a  pas  que  le 
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manque  de  sincérité  qui  produise  des  erreurs  constantes  : 
des  défauts  d'organisation,  le  manque  de  clarté  des  instruc- 
tions données  aux  recensés,  comme  aux  agents  recenseurs, 
peuvent  conduire  à  des  résultats  tout  aussi  erronés  que  la 
crainte  ou  l'intérêt.  Cependant,  comme  il  faut  donner  un 
nom  à  cette  partie  de  la  critique,  nous  l'avons  appelée  ((  cri- 
tique de  sincérité  »  à  raison  des  dispositions  d'ordre  psy- 
chologique qu'elle  a  en  vue,  en  ordre  principal.  Il  faut  s'en- 
tendre aussi  sur  l'expression  «  erreurs  constantes  ».  On  ne 
veut  point  signifier  par  là  des  erreurs  se  reproduisant  à 
chaque  occasion,  mais  simplement  des  erreurs  ayant  une 
tendance  à  se  répéter  dans  un  même  sens  un  grand  nombre 
de  fois,  au  lieu  que  les  erreurs  fortuites  dépassent  parfois 
la  mesure  et  restent  parfois  en  deçà.  La  crainte  et  l'intérêt 
sont  des  mobiles  dont  l'action  est  très-  étendue,  mais  il  est 
clair  qu'ils  ne  vicient  pas  toutes  les  réponses,  tout^n  en 
rendant  suspectes  un  grand  nombre.  Ces  distinctions  ne 
doivent  pas  être  perdues  de  vue  au  cours  de  l 'exposé  qui  va 
suivre. 

112.  L'inexactitude  voulue  des  réponses  données  au  bul- 
letin statistique  provient,  très  fréquemment,  de  la  crainte 
des  auteurs  du  document  que  des  réponses  sincères  ne 
tournent  à  leur  préjudice. 

Cette  crainte  résulte  de  l'ignorance  ou  de  l'intérêt  mal 
entendu;  il  peut  s'agir  de  l'intérêt  matériel  et  de  l'intérêt 
moral.  Examinons  brièvement  les  diverses  hypothèses  qui 
peuvent  se  présenter. 

A.  —  Crainte  de  mesures  fiscales  ou  de  réglementation. 
—  Mobile  très  général  auquel  obéissent  de  nombreuses  per- 
sonnes. Des  patrons,  principalement  de  la  petite  industrie, 
hésitent  à  inscrire  sur  leur  bulletin  le  nombre  exact  de  leurs 
ouvriers  et  de  leurs  employés,  afin  de  ne  pas  faire  classer 
leur  établissement  dans  une  catégorie  plus  élevée  en  vue  de 
la  patente.  En  1846  déjà,  Quetelet  signalait  cette  cause 
d'inexactitude  à  propos  du  premier  recensement  général  de 
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l'industrie  qui  eût  été,  jusqu'alors,  exécuté  en  Europe.  L'in- 
terprétation fondée  sur  oe  mobile  est  encore  exacte  aujour- 
d'hui, bien  que  le  progrès  de  l'instruction  et  l'expansion  des 
affaires  l'aient  atténuée  ou  même  fait  disparaître  dans  une 
certaine  mesure.  A  notre  époque,  les  grands  établissements 
industriels,  groupant  dans  leurs  ateliers  et  leurs  chan- 
tiers une  fraction  de  plus  en  plus  notable  de  la  population 
ouvrière,  sont  habituellement  rangés  dans  la  première 
classe  des  patentes,  de  telle  sorte  que  l'intérêt  qu'il  y  avait 
à  déclarer  un  nombre  d'ouvriers  inférieur  à  la  réalité 
n'existe  plus;  d'ailleurs,  en  présence  de  Pénormité  des 
taxes  qu'ils  acquittent  déjà,  la  majoration  d'un  impôt  ac- 
cessoire ne  peut  plus  présenter  aux  yeux  des  industriels 
qu'un  intérêt  secondaire.  Par  contre,  cet  intérêt  continue  à 
exister  pour  les  chefs  des  petites  entreprises,  plus  resser- 
rés d|jns  leurs  moyens  et  plus  portés  à  lésiner.  Un  critère  de 
différenciation  sera  donc  la  grandeur,  l'importance  de  l'en- 
treprise :  le  statisticien  se  montrant  plus  sévère  et  se  tenant 
plus  sur  ses  gardes  à  l'égard  des  déclarations  faites  pour 
des  exploitations  de  minime  importance  que  pour  celles 
relatives  à  des  établissements  très  importants. 

On  ne  pourrait  en  dire  autant  de  la  critique  appliquée 
aux  questions  du  bulletin  ayant  rapport  à  des  mesures  de 
réglementation  du  travail.  Souvent,  l'opposition  aux  me- 
sures législatives  de  ce  genre  est  conduite  par  des  associa- 
tions de  grands-  industriels.  Il  est  à  craindre  dès  lors  que 
les  réponses  individuelles  ne  soient  inspirées  de  la  même 
politique  et  ne  procèdent  d'un  mot  d'ordre.  Répondre  dans 
un  sens  indiqué  d'avance,  et  non  conformément  à  la  réalité, 
est  un  tort  qui  n'est  pas  uniquement  celui  d'industriels  non 
interventionnistes;  on  peut  l'imputer  aussi  à  d'autres  mi- 
lieux où  les  idées  sont  au  pôle  opposé  :  nous  voulons  dire  les 
syndicats  ouvriers.  Que  d'enquêtes  sans  vie,  sans  portée  et 
sans  résultat  à  cause  de  ce  parti  pris  !  Les  réponses  arrivent 
stéréotypées,  identiques  pour  des  industries  ou  des  locali- 
tés placées  dans  des  conditions  différentes.  Rédigées  par  un 
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secrétaire  de  syndicat,  du  fond  d'un  bureau,  elles  ne  s'adap- 
tent même  pas  aux  énoncés  précédents  et  cette  unanimité, 
loin  de  faire  impression,  ne  fait  que  provoquer  une  défiance 
trop  justifiée. 

Est-il  besoin  d'ajouter  qu'une  enquête  viciée  dans  ces 
conditions  est  inutilisable  et  ne  peut  même  être  améliorée? 
Le  parti  pris,  les  réponses  formulées  d'après  un  mot 
d'ordre,  fournissent  l'exemple  le  plus  complet  d'erreurs 
constantes. 

113.  Si  le  statisticien  ne  peut  toujours  éviter  de  poser  des 
questions  de  nature  à  faire  redouter  des  répercussions  d'or- 
dre financier  ou  législatif, il  peut, tout  aumoins, prendre  des 
mesures  d'abord  pour  prévenir  une  crainte  légitime,  ensuite 
pour  empêcher  que  les  fausses  déclarations  ne  viennent 
fausser  les  résultats.  On  ne  manquera  pas  de  faire  remar- 
quer aux  recensés  le  but  scientifique  de  la  statistique,  but 
totalement  étranger  aux  préoccupations  d'ordre  fiscal.  Le 
bulletin  du  recensement  belge  de  1896  débute  par  plusieurs 
((  observations  générales  »  dont  la  première  est  ainsi  con- 
çue :  ((  Le  recensement  industriel  actuel  n  'est  que  la  répéti- 
tion d'opérations  du  même  genre  effectuées  en  1846,  en 
1860  et  en  1880.  Il  a  pour  but  de  faire  connaître  les  princi- 
pales conditions  de  l'industrie;  il  ne  se  rattache  à  aucun 
projet  déterminé  de  réglementation,  ni  à  aucune  mesure 
fiscale  ».  Le  recensement  de  1910  a  répété  le  même  avis,  en  y 
ajoutant  l'exemple  du  recensement  précédent,  celui  de  1896. 

Au  dos  du  bulletin  du  recensement  français  de  la  popula- 
tion figure  une  «  notice  sur  le  dénombrement  »  précisant  la 
portée,  spécialement  démographique,  de  l'opération  statis- 
tique et  faisant  ressortir  l 'ancienneté  de  ce  relevé.  Elle  est 
suivie  de  la  note  suivante  :  «  Nota  —  Les  réponses  que 
chaque  habitant  fera,  en  toute  sincérité,  aux  questions  po- 
sées ne  peuvent,  en  aucune  façon,  et  à  aucun  moment,  lui 
occasionner  un  trouble  ou  un  dommage  quelconque  ». 

S'il  est  utile  de  rassurer  le  public  au  sujet  de  la  portée 
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des  enquêtes  statistiques,  il  est  d'autre  part  indispensable 
de  prendre  des  garanties  contre  le  manque  de  sincérité  de 
ceux  des  recensés  qui  ne  se  seraient  pas  laissé  persuader. 
Ce  sera  peut-être  le  plus  grand  nombre.  Au  moyen  d'une 
rapide  analyse  psychologique,  on  arrive  facilement  à  déter- 
miner celles  des  données  du  questionnaire  capables  d'éveil- 
ler quelque  appréhension.  Ces  données  sont  ensuite  sou- 
mises à  une  épreuve  systématique.  Il  ne  suffit  pas  de  rester 
sceptique  devant  certaines  assertions.  Le  statisticien  doit 
arriver  à  une  solution  positive.  Si  tel  chiffre  est  supposé 
inexact,  comment  le  savoir  de  science  certaine,  et  par  quel 
autre  le  remplacer?  La  technique  moderne  a  organisé  plu- 
sieurs contrôles  généraux  de  ce  genre.  Au  nombre  des  pins 
intéressants  figure  celui  qui  met  en  parallèle  les  déclara- 
tions des  patrons  et  celles  des  ouvriers. 

114.  On  trouve  ainsi  moyen  de  corriger  des  erreurs  gé- 
néralisées en  dépit  des  instructions  et  des  mesures  d'orga- 
nisation. Cette  façon  de  procéder  a  été  adoptée  par  plu- 
sieurs recensements.  On  a  imaginé  de  faire  déclarer  par  les 
ouvriers  et  employés  le  nom,  l'adresse  et  l'industrie  de  l'em- 
ployeur; de  cette  manière,  on  dispose  d'un  matériel  de  con- 
trôle à  l'égard  du  chiffre  indiqué  par  le  patron  en  ce  qui 
regarde  son  personnel.  La  Hongrie,  en  1890,  a  été  la  pre- 
mière à  utiliser  cette  indication  ;  elle  fut  suivie  par  la  Bel- 
gique et  par  la  France  en  1896;  depuis  1901,  cette  or- 
ganisation est  entrée  définitivement  en  vigueur  dans  le 
recensement  français  qui  a  pris  des  mesures  pour  que  les 
bulletins  des  ouvriers  et  employés  appartenant  à  une  même 
entreprise  soient  groupés  dès  le  moment  où  les  mairies 
opèrent  les  premiers  classements.  Ce  n'est  pas  le  moment 
d'entrer  dans  le  détail  de  ces  opérations.  Elles  seront  expo- 
sées in  extenso  dans  la  partie  qui  a  trait  aux  recensements, 
mais  c'est  ici  qu'il  convient  de  dire  quelques  mots  de  la  va- 
leur critique  du  procédé. 

Cette  méthode  est  très  efficace  pour  mettre  obstacle  à  ce 
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que  des  entreprises  soient  omises  ou  soient  comptées  plu- 
sieurs fois,  pour  caractériser  la  nature  de  l'industrie  exer- 
cée et  pour  empêcher  que  les  patrons  n'omettent  de 
déclarer  le  personnel  qu'ils  occupent.  Mais  le  point  inté- 
ressant consiste  dans  la  conformité  des  déclarations  patro- 
nales et  ouvrières.  Il  peut  y  avoir  identité  entre  le  nombre 
de  bulletins  d'ouvriers  annexés  au  bulletin  d'entreprise  et 
le  nombre  d'ouvriers  et  d'employés  déclaré  par  le  chef  d'en- 
treprise ;  dans  ce  cas,  il  n  'y  a  évidemment  aucune  modifica- 
tion à  apporter  au  bulletin  patronal,  mais  les  règles  adop- 
tées dans  les  deux  autres  cas  par  le  service  du  recensement 
français  aboutissent,  en  fait,  à  compter  au  maximum  les 
ouvriers  :  si  le  nombre  déclaré  par  le  patron  est  in- 
férieur au  nombre  de  bulletins  trouvés,  on  le  porte.,  en  l'aug- 
mentant, à  ce  dernier  chiffre;  s'il  lui  est  supérieur,  on  ne 
le  réduit  pas,  sans  doute  parce  qu'on  suppose  que  les  bul- 
letins ouvriers  manquants  se  sont  égarés.  Il  semble  que 
cette  règle,  à  la  considérer  avec  quelque  attention,  ne  soit 
pas  aussi  satisfaisante  qu'elle  le  paraît  à  première  vue.  Elle 
s'inspire  évidemment  de  la  pensée  que  le  maître  a  intérêt  à 
dissimuler  le  chiffre  vrai  de  son  personnel,  alors  que  l'ou- 
vrier n  'en  a  aucun  à  déclarer  qu  'il  travaille  pour  le  compte 
de  tel  patron  plutôt  que  pour  le  compte  de  tel  autre.  Ceci  est 
exact,  mais  ce  n'est  pas  toute  la  question;  l'ouvrier  a  aussi 
un  intérêt  à  faire  une  déclaration  :  celle  qu'il  n'est  pas  en 
état  de  chômage,  et  plutôt  que  de  se  faire  connaître  comme 
chômeur  il  n'hésitera  pas  à  inscrire  sur  son  bulletin  le  nom 
d'un  ancien  patron  ou  de  toute  autre  personne.  Entre  ces 
deux  intérêts,  il  n'y  a  pas  possibilité  de  se  prononcer  d'une 
façon  décisive,  aussi  la  règle  rapportée  plus  haut  a-t-elle  le 
défaut,  dans  sa  généralité,  de  trancher  d'une  façon  systéma- 
tique des  cas  douteux.  Il  paraît  plus  satisfaisant  de  s'en 
tenir  aux  déclarations  émanant  des  ouvriers,  dans  tous  les 
cas,  ou,  ce  qui  vaudrait  mieux,  de  prendre  texte  de  ces  décla- 
rations pour  réclamer  au  chef  d'entreprise  des  éclaircisse- 
ments complémentaires. 
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.  La  statistique  des  grèves  présente  aussi  des  données  qui, 
empruntées  à  une  source  unique,  seraient  fort  sujettes  à 
caution.  Après  un  conflit  qui  a  excité  toutes  sortes  de  pas- 
sions, il  est  évident  que  le  récit  qu'en  fera  chacune  des 
parties  en  cause  différera  sensiblement.  Réclamer  unique- 
ment aux  patrons  les  renseignements  concernant  les  grèves 
qui  viennent  de  se  produire  dans  leurs  établissements,  c'est 
admettre  à  l'avance  que  la  statistique  sera  unilatérale  et 
tendancieuse.  Aussi,  s'est-on  déterminé  à  consulter  en  outre 
sur  les  circonstances,  les  causes  et  les  résultats  des 
grèves,  les  associations  ouvrières.  Tel  est  le  système 
suivi  en  Italie,  où  l'on  réclame  en  outre  aux  Préfets  des 
renseignements  analogues.  Les  déclarations  ouvrières  con- 
trôlent le  patronat,  et  vice-versa;  le  document  dressé  par 
l'autorité  administrative  sert  d'épreuve  et  indique  en  quel 
sens  la  balance  doit  pencher.  On  peut  y  ajouter  les  extraits 
de  journaux  qui  ont  relaté  l'incident.  De  cette  façon,  «  sta 
tistiquer  »  une  grève  devient  un  véritable  travail  de  critique 
exigeant  beaucoup  de  patience  unie  à  un  grand  bon  sens  et 
à  une  parfaite  équité. 

Au  heu  de  comparer  des  données  venant  de  source  diffé- 
rente, mais  se  rapportant  à  une  même  recherche,  on  peut 
encore  se  livrer  à  des  aperçus  critiques  basés  sur  la  con- 
frontation de  données  portant  sur  le  même  sujet,  mais  re- 
cueillies à  des  moments  différents  par  des  autorités  di- 
verses, chacune  dans  un  but  particulier.  Le  degré  d'instruc- 
tion, par  exemple,  peut,  dans  une  population  donnée,  s'ap- 
précier par  trois  moyens  différents  :  1°  en  posant  directe- 
ment la  question  :  «  savez-vous  lire  et  écrire  »  dans  le  recen- 
sement général  de  la  population;  2°  en  classant  les  conscrits 
d'après  leur  degré  d'instruction  au  moment  où  ils  sont  ver- 
sés au  corps  ;  3°  en  relevant  le  nombre  d'époux  qui  n'ont  pu 
signer  l'acte  de  mariage,  soit  que  leur  ignorance  résulte  de 
la  croix  apposée  en  lieu  et  place  de  leur  signature,  soit 
qu'elle  soit  constatée  par  leur  déclaration. 

Indépendamment  de  l'intérêt  que  présente  la  comparai- 
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son  de  ces  données  à  un  point  de  vue  général,  on  peut  en 
tirer  des  conclusions  quant  à  l'exactitude  présumée  de 
chaque  relevé  :  les  concordances  constituent  un  indice  favo- 
rable, les  discordances  servent  à  faire  naître  un  doute  et  à 
provoquer  une  information  complémentaire. 

115.  B.  —  Crainte  de  désavantages  d'ordre  moral.  — 
L'intérêt,  qui  incite  à  faire  des  déclarations  inexactes,  peut 
ne  pas  être  un  intérêt  matériel.  Certaines  questions  des  re- 
censements peuvent  provoquer  des  susceptibilités  d'ordre 
moral.  Les  demandes  concernant  les  cultes  nous  paraissent 
rentrer  dans  cette  catégorie.  Parmi  les  recensements  effec- 
tués en  Europe,  les  uns  s'abstiennent  de  poser  la  question, 
les  autres  formulent  la  demande  avec  plus  ou  moins  de  dé- 
tails. En  Angleterre,  en  France,  en  Belgique,  en  Portugal, 
il  n'y  a  pas  de  questions  posées  en  ce  qui  concerne  la  reli- 
gion des  recensés  ;  au  contraire,  ce  point  fait  partie  des  in- 
vestigations du  recensement  en  Allemagne,  en  Autriche, 
en  Espagne,  en  Norvège,  en  Russie,  en  Suède,  dans  les 
Pays-Bas,  etc.  Il  peut  arriver  que  beaucoup  de  déclarations 
faites  sur  ce  point  soient  suspectes.  On  ne  peut  non  plus  s 'at- 
tendre à  une  grande  sincérité  de  la  part  des  recensés  quand 
le  gouvernement  s'enquiert  des  tares  physiques  ou  mo- 
rales :  le  dénombrement  des  idiots,  des  fous,  des  sourds- 
muets,  habitant  avec  les  membres  de  leur  ménage,  ne  sera 
jamais  complet,  car  les  familles  cachent  aussi  longtemps 
qu'elles  le  peuvent  les  infirmités  dont  leurs  membres  sont 
atteints.  On  peut  aller  plus  loin  et  altérer  la  vérité,  afin  de 
retarder  l'accomplissement  d'un  devoir  civique  pénible  ou 
onéreux.  M.  Benini  a  signalé  que  si,  dans  l'Italie  méridio- 
nale, le  nombre  des  naissances  mâles  en  décembre  descend 
au-dessous  de  la  normale,  tandis  qu'au  contraire  le  mois 
de  janvier  est  au-dessus  de  la  moyenne,  la  raison  en  est 
à  la  coutume  des  parents  de  différer  de  quelques  jours 
les  déclarations  des  naissances  mâles  survenues  à  la  fin  de 
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décembre,  afin  de  retarder  d'un  an  l'appel  sous  les  dra- 
peaux. 

116.  C.  —  Paresse,  négligence,  mauvaise  volonté  des  re- 
censés et  des  agents  recenseurs.  —  Pour  pouvoir  exécuter 
une  statistique  dans  de  bonnes  conditions,  il  faut  pouvoir 
compter  sur  la  conscience,  le  soin  et  la  fidélité  des  agents 
qu'on  emploie;  dans  une  certaine  mesure,  ces  qualités  doi- 
vent exister  chez  les  personnes  qu'on  interroge;  elles 
doivent  se  retrouver  au  plus  haut  degré  chez  tous  ceux  qui 
dirigent  le  travail  ou  collaborent  à  la  direction  : 

a)  Pour  obtenir  des  résultats  satisfaisants,  le  chef  d'un 
bureau  de  statistique  doit  absolument  pouvoir  compter  sur 
le  bon  vouloir  des  agents  recenseurs  et  des  commis  occupés 
au  travail  de  dépouillement.  Une  des  conditions  requises 
pour  que  ce  bon  vouloir  existe  et  se  manifeste  est  une  équi- 
table rémunération  accordée  aux  uns  comme  aux  autres. 
Contraindre  des  agents  inférieurs  à  exécuter  une  besogne 
qu'ils  font  à  contre-cœur  ou  dont  les  conditions  leur  dé- 
plaisent est  une  détestable  politique.  Les  économies 
qu'on  pense  réaliser  par  ces  moyens  finissent  par  occasion- 
ner une  dépense  double.  L'agent  recenseur,  notamment,' a 
un  rôle  très  important  à  remplir.  La  vérification  des  bulle- 
tins ou  formulaires  lors-  de  la  reprise  à  domicile  de  ces  docu- 
ments, lui  incombe.  C'est  à  lui  également  qu'il  faut  avoir 
recours  s'il  s'agit  d'obtenir  des  renseignements  complémen- 
taires ou  de  rectifier  des  erreurs.  Quelles  que  soient  les  pré- 
cautions prises  en  vue  du  choix  de  ces  agents  et  si  complètes 
que  soient  les  instructions  qui  leur  sont  données,  la  vérifi- 
cation de  leur  travail  est  d'une  nécessité  absolue.  Le  plus 
élémentaire  bon  sens  commande  de  s'assurer  de  la  façon 
dont  les  instructions  ont  été  exécutées.  Les  erreurs  peuvent 
être  tantôt  accidentelles  et  isolées  lorsqu'elles  sont  dues  à 
l'interprétation  erronée  d'une  seule  personne  qui,  par 
exemple,  se  croit,  à  tort,  dans  l'obligation  de  répondre  au 
bulletin  alors  qu'elle  ne  rentre  pas  dans  les  catégories  vi- 
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sées  par  la  statistique.  On  peut  aussi  classer  parmi  les  er- 
reurs accidentelles,  l'interprétation  trop  large  donnée  au 
relevé  par  un  agent  recenseur  isolé.  Mais  à  côté  de  ces 
erreurs  accidentelles,les  administrations  locales  et  les  agents 
recenseurs  en  commettent  d'autres  qui  ont  un  caractère  sys- 
tématique et  général.  Ainsi,  dans  un  recensement  industriel 
on  constata  que  certaines  administrations  communales 
avaient  délivré  des  bulletins  à  des  personnes  exerçant  des 
professions  libérales  ou  agricoles,  à  des  ménagères,  à  des 
fonctionnaires  et  même  à  des  personnes  sans  profession. 
Par  contre,  dans  quelques  communes-,  des  omissions  singu- 
lières avaient  été  commises  :  par  exemple,  on  n'avait  re- 
censé que  les  patrons  sans  remettre  de  bulletin  individuel 
aux  ouvriers,  ou  l'on  s'était  borné  à  remettre  des  formu 
laires  aux  industriels  et  aux  commerçants  dont  l'exploita- 
tion semblait  présenter  une  certaine  importance.  Dans  une 
petite  ville,  les  agents  recenseurs  avaient  laissé  en  dehors 
du  recensement  toutes  les  personnes  du  sexe  féminin  (1). 
Après  des  exemples  tels  que  ceux-là,  personne  ne  pourra 
plus  douter  de  l'utilité  d'une  revision  des  plus  attentives. 

b)  Les  recensés,  de  leur  côté,  peuvent  apporter  leur  con- 
tingent de  mauvaise  volonté  et  de  négligence  dans  l'en- 
semble des  facteurs  défavorables  à  l'exactitude  des  résul- 
tats. Sans  être  altérées  par  l'appât  du  gain  ou  par  la  crainte 
d'un  désavantage,  les  réponses  des  recensés  peuvent  se 
trouver  singulièrement  diminuées  de  valeur  à  raison  de  la 
négligence  avec  laquelle  elles  sont  formulées.  Si  l'on  a  des 
raisons  de  soupçonner  que  ce  défaut  est  général,  on  devra  se 
montrer  d'autant  plus  rigoureux  dans  l'examen  critique  du 
bulletin. 

117.  Enfin,  l'éditeur  même  du  travail  a  sa  part  de  res- 
ponsabilité. On  peut  appliquer  à  un  travail  statistique  les 


(1)  Belgique  :  Recensement  de  l'industrie  et  du  commerce  au  31  dé- 
cembre 1910.  Vol.  I.  Exposé  des  méthodes,  ch.  III,  paragr.  2  et  3.  Bruxelles, 
1913. 
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méthodes  critiques  qui  s'appliquent  à  toute  œuvre  littéraire 
et  se  demander  dans  quel  esprit  le  travail  a  été  fait.  A-t-on 
voulu  exposer  la  vérité,  et  rien  qu'elle?  N 'a-t-on  pas  été 
préoccupé  d'accumuler  des  matériaux  dans  le  but  de  pro- 
duire de  l'effet,  d'en  imposer  par  la  masse  des  données?  Ce 
sont  des  questions  très  délicates,  aussi  le  critique  fera  bien 
de  n'avancer  que  pas  à  pas  sur  ce  terrain  dangereux.  Au- 
jourd'hui, on  attend  de  l'éditeur  d'un  travail  qu'il  fasse 
l'exposé  complet  de  ses  sources  et  de  sa  méthode.  Cette  ha- 
bitude est  entrée  dans  les  mœurs  en  ce  qui  concerne  plu- 
sieurs branches  scientifiques,  les  sciences  historiques;  par 
exemple.  Il  existe  dans  chaque  pays  des  ouvrages  et  des  re- 
vues consacrés  aux  questions  de  méthode  historique.  Bien 
qu'il  y  ait  une  tendance  sérieuse  et  générale  en  statistique 
à  suivre  cet  exemple,  on  ne  peut  dire  encore  que  plus  rien 
n'est  à  souhaiter.  Beaucoup  de  publications  officielles  se 
montrent  encore  d'un  laconisme  par  trop  grand  dans  la 
description  des-  procédés  suivis  dans  les  travaux  qu'elles 
présentent. 

Est-il  besoin  de  dire  qu'en  aucun  cas  le  statisticien  n'a  le 
droit  de  modifier  les  chiffres  obtenus  à  l'aide  du  relevé? 
S'ils  ne  sont  pas  complets,  il  se  bornera  à  signaler  les 
lacunes  et  à  en  exposer  brièvement  les  motifs  en  note  au  bas 
de  la  page.  Dans  le  cas  où,  à  l'aide  de  méthodes  spéciales,  il 
aurait  réussi  à  faire  disparaître  certaines  lacunes,  il  doit  le 
faire  observer  et  faire  connaître  les  procédés  employés.  En 
cas  de  discordance  de  certains  chiffres  avec  certains  autres, 
l'erreur  doit  être  recherchée  jusqu'à  ce  qu'elle  soit  décou- 
verte et  corrigée.  Toute  discordance  n'est  pas  le  résultat 
d'une  erreur  :  elle  peut  aussi  provenir  de  l'emploi  de  mé- 
thodes différentes  de  comptage;  ces  cas  seront  soigneuse- 
ment exposés  dans  l'exposé  des  méthodes  et  l'explication 
rappelée  en  note.  On  n'a  jamais  le  droit  de  modifier  sciem- 
ment un  chiffre  afin  d'obtenir  une  concordance  trompeuse. 
Nous  aimons  à  croire  que  ces  règles,  les  plus  élémentaires 
de  la  probité  scientifique,  ont  été  toujours  et  partout  res- 
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pectées  par  les  statisticiens.  Aujourd'hui  personne  n'ad- 
mettrait que  des  manquements  à  ces  principes  puissent  être 
commis  et  nous  croyons  pouvoir  dire  qu'effectivement  il  m* 
s'en  commet  point  dans  une  mesure  appréciable. 

CHAPITRE  III 

Critique  d'exactitude 

118.  Les  causes  d'erreur  relevées  par  la  critique  de  sin- 
cérité dérivent  toutes  des  mobiles  que  les  anciens  traités 
comprennent  sous  le  nom  d'  «  animus  observandi  »,  soit 
dans  le  chef  de  l'organe  de  l'observation  statistique,  soit 
dans  le  chef  de  celui  qui  se  prête  à  l'observation.  Par  leur 
nature,  qui  est  d'essence  psychologique,  elles  sont  suscep- 
tibles d'une  analyse  systématique  relativement  simple  :  il 
suffit  d'énumérer  et  de  classer  les  raisons  qui  peuvent  agir 
pour  diminuer  la  sincérité  des  réponses  des  recensés,  comme 
celles  qui  ont  une  action  sur  la  diligence  des  organes  du  re- 
levé. Au  contraire  les  erreurs  que  la  critique  d'exactitude 
a  pour  objet  de  signaler  sont  accidentelles.  11  est  donc  im- 
possible d'en  dresser  d'avance  une  liste  complète  et  il  faut 
vérifier,  dans  chaque  cas,  les  causes  qui  ont  pu  vicier  le  do- 
cument. 

L'examen  auquel  donne  lieu  cette  recherche  peut  se  divi- 
ser en  deux  parties  distinctes  :  a)  vérification  interne^ 
b)  vérification  externe. 

La  vérification  interne  elle-même  se  subdivise  en  trois 
parties  :  a)  recherches  des  lacunes  possibles  du  relevé  ^ 
b)  recherche  des  multiples  emplois,  ou  recensement  double 
(multiple,  en  certains  cas)  des  mêmes  unités;  c)  recherche 
des  erreurs  accidentelles,  contradictions  et  autres  défauts 
des  réponses. 

La  vérification  externe  consiste  à  s'assurer  que  tous  le» 
détails  matériels  de  l'exécution,  calculs  de  tout  genre,  im- 


192 


PRINCIPES  DE  STATISTIQUE 


pression  des-  résultats,  etc.,  sont  conformes  aux  résultats 
obtenus. 

La  critique  d'exactitude  est  l'une  des  parties  les  plus 
pénibles  du  travail  statistique.  Elle  suppose  chez  celui  qui 
s'y  livre  une  attention  extrême,  une  patience  à  toute 
épreuve,  une  constance  que  ne  rebute  aucune  besogne  aussi 
fastidieuse  qu'on  puisse  l'imaginer,  une  probité  au-dessus 
de  tout  soupçon.  Ces  qualités  si  rares  doivent  exister  non 
seulement  dans  la  direction,  mais  aussi  parmi  les  agents 
subalternes.  Le  public  apprécie  trop  peu  la  valeur  morale  et 
intellectuelle  requise  pour  les  travaux  de  statistique  ;  peut- 
être  le  lecteur,  après  avoir  parcouru  les  pages  qui  suivent, 
s'en  formera-t-il  une  idée  plus  favorable  et  surtout  plus 
juste. 

I.  —  Vérification  interne. 

119.  a)  Recherche  des  lacunes  de  la  statistique.  — 
Aucune  statistique  quelconque,  —  nous  l'avons  fait  obser- 
ver au  début  de  cet  exposé,  —  ne  peut  prétendre  à 
une  exactitude  absolue  :  celle-ci  serait  d'ailleurs  hors  de 
proportion  avec  les  résultats  à  atteindre  et  l'usage  qui  est 
fait  de  ces  résultats.  Mais  entre  l'exactitude  absolue  et 
l'erreur  véritable,  il  y  a  un  degré  intermédiaire,  beaucoup 
plus  rapproché  du  premier  terme  que  du  second,  qu'il  faut 
absolument  atteindre.  Il  est  impossible  de  tracer  des  règles 
théoriques-  indiquant  la  marge  tolérable,  parce  que  cette 
limite  est  essentiellement  variable  d'après  les  sujets  traités 
et  d'après  le  nombre  d'unités  relevées.  Le  bon  sens  indique 
suffisamment  qu'une  erreur  de  10  unités  sur  le  total  est  très 
différente  quand  le  chiffre  exact  est  100  et  quand  il  est  1,000. 
L'importance  de  l'erreur,  et  par  conséquent  la  tolérance 
admise  dépend  aussi  de  la  nature  de  l'unité;  il  y  a  des  uni- 
tés égales  comme  poids  statistiques,  —  les-  individus  com- 
pris dans  un  recensement  de  la  population  —  et  il  en  est 
d'autres  dont  le  poids  varie  prodigieusement  —  l'unité 
«  entreprise  »  dans  un  recensement  industriel,  par  exemple. 
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Dans  le  premier  cas,  une  unité  en  vaut  une  autre,  l'absence 
de  l'une  n'exerce  pas  une  action  plus  marquée  sur  le  résul- 
tat final  que  l'absence  de  l'autre;  au  contraire,  dans  le  se- 
cond cas,  certaines  unités  en  valent  cent  et  mille  autres. 
L'omission  d'un  grand  établissement  industriel  diminue- 
rait le  total  recensé  d'un  millier  (ou  plus)  d'ouvriers,  d'em- 
ployés, de  chevaux-vapeur,  alors  que  celle  de  l'entreprise 
d'un  charron  de  village  ne  ferait  que  réduire  d'une  unité  ou 
deux  le  nombre  des  exploitants  et  celui  des  membres  de  la 
famille  des  exploitants.  De  plus,  si  un  établissement  indus- 
triel important  se  trouve  omis  dans  le  relevé,  il  peut  arriver 
que  ce  soit  dans  une  catégorie  qui  ne  compte  que  très  peu 
d'entreprises;  la  lacune  a  alors  une  gravité  proportionnelle 
à  la  rareté  des  unités  comprises  dans  cette  catégorie.  On 
voit  par  là  que  la  recherche  des  unités  omises  n'a  pas  par- 
tout une  égale  importance  et  que  les  résultats  de  cette 
recherche  n'ont  pas  dans  tous  les  cas  la  même  valeur.  L'at- 
tention et  les  efforts  déployé»  seront  naturellement  en  pro- 
portion de  ceci. 

Comment  procéder  pour  constater  ces  lacunes?  Que  faut- 
il  faire  pour  les  faire  disparaître? 

Nous  répondons  à  la  première  question  en  énumérant 
quelques-uns  des  moyens  de  vérification  qu'il  est  possible 
d'employer.  Cette  énumération  n'est  pas  complète,  elle  ne 
peut  l'être,  chacun  le  comprend.  Chaque  difficulté  trouve 
sa  solution  si  elle  est  étudiée  par  un  homme  intelligent  et 
surtout  consciencieux,  mais  il  y  a  autant  de  solutions  pos- 
sibles que  de  cas  différents;  on  est  donc  en  dehors  des 
limites  de  l 'énumération  et  les  procédés  indiqués  ci-après  ne 
sont  qu'exemplatifs. 

Il  y  a  d'abord  une  sorte  d'analyse  logique  qui  fera  recon- 
naître si  dans  les  résultats  du  relevé,  il  ne  se  rencontre  rien 
d'invraisemblable.  Dans  un  dénombrement  de  la  popula- 
tion, il  paraîtrait  singulier  que  le  nombre  d'hommes  fût, 
dans  une  localité,  deux  fois  plus  grand  que  le  nombre  de 
femmes,  ou  vice-versa,  à  moins  que  dans  cette  localité  il  y 
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ait  nne  raison  qui  explique  cette  anomalie  :  une  forte  gar- 
nison militaire,  un  grand  collège  de  garçons,  une  maison  de 
correction  pour  jeunes  gens,  etc.  En  dehors  de  circonstances 
de  l'espèce,  un  écart  très  marqué  dans  la  proportion  des 
deux  sexes  est  un  indice  qu'il  ne  faut  pas  négliger  dans  la 
lutte  engagée  avec  l'erreur.  S'agit-il  d'un  recensement  in- 
dustriel? Ici  les  contrôles  basés  sur  la  simple  vraisemblance 
se  multiplient.  Ainsi,  la  présence  d'ouvriers  masculins  iso- 
lés au  milieu  d'une  très  nombreuse  population  ouvrière 
féminine,  dans  des  métiers  de  femmes,  attirera  l'attention 
et  est  de  nature  à  justifier  quelques  recherches  complémen- 
taires. Ce  n'est  pas  à  dire  que  l'inscription  d'ouvriers  mas- 
culins soit  toujours,  dans  un  cas  de  l'espèce,  le  résultat 
d'une  erreur;  on  ne  peut  oublier  que  le  vrai  n'est  pas  tou- 
jours vraisemblable,  mais  elle  doit  susciter  l'attention  et 
provoquer  un  supplément  d'information.  Nous  trouvons  des 
ouvriers  mâles  exerçant  la  profession  de  dentellière;  des 
mains  masculines  paraissent  inhabiles  à  manier  les  fu- 
seaux; cependant,  vérification  faite,  le  relevé  n'était  pas 
erroné;  c'est  que  la  technique  dentellière  est  si  profondé- 
ment ancrée  dans  certains  centres  de  population  qu'elle 
s'apprend  par  imitation  et  que  des  chômeurs  ou  des  inva- 
lides s'y  appliquent  pour  gagner  un  faible  salaire. 

120.  L'exposé  des  différents  points  de  contrôle  utilisables 
excéderait  les  limites  d'un  ouvrage  général  tel  que  celui-ci. 
Il  faut  se  borner  à  indiquer  le  principe  et  à  en  faire  une  ap- 
plication. La  sagacité  et  aussi  l'ingéniosité  scientifique  de 
celui  qui  se  livre  à  ce  travail  de  revision  sauront  tirer  des 
résultats  nombreux  et  variés  de  l'analyse  logique  du  docu- 
ment. 

Au  nombre  des  moyens  employés  le  plus  fréquem- 
ment, signalons  la  comparaison  établie  entre  les  données 
nouvelles  et  les  résultats  d'un  autre  relevé  portant  sur 
un  même  objet,  mais  exécuté  antérieurement  et  utilisant 
des  informations  provenant  d'une  autre  source.  Les  résul- 
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tats  obtenus  à  l'aide  d'un  dénombrement  général  sont  ainsi 
souvent  comparés  à  ceux  indiqués  par  un  relevé  ne  portant 
que  sur  certaines  parties  de  l'ensemble.  Ce  procédé  sup- 
pose que  la  statistique  spéciale  présente  de  .  plus  grandes 
garanties  d'exactitude  que  la  statistique  générale.  Ceci 
est  parfaitement  d'accord  avec  la  logique.  Pour  les  sta- 
tistiques spéciales,  on  a  recours  habituellement  à  des 
agents  plus  qualifiés  que  les  simples  recenseurs;  sou- 
vent aussi  leurs  fonctions  habituelles  les  mettent  en 
rapport  quotidien  avec  les  personnes  ou  les  entreprises 
qu'ils  sont,  par  occasion,  chargés  de  recenser.  Il  se  com- 
prend aisément  que  les  ingénieurs  du  corps  des  mines  soient 
à  même  d'opérer  un  recensement  plus  exact  des  charbon- 
nages que  celui  obtenu  à  l'aide  d'un  dénombrement  portant 
sur  toutes  les  industries  du  pays,  puisque  leurs  fonctions 
administratives  les  mettent  en  contact  journalier  avec  les 
entreprises  houillères  situées  dans  leur  ressort.  Aussi,  est- 
il  tout  indiqué  que  le  statisticien  chargé  d'un  dénombrement 
général  compare  les  données  qu'il  a  obtenues  avec  celles 
fournies  par  la  statistique  spéciale  des  charbonnages.  C'est 
une  garantie  excellente  à  l'égard  des  lacunes  qui  peuvent  si 
facilement  se  produire  dans  un  relevé  exécuté  par  des 
agents  peu  qualifiés,  disséminés  sur  tout  le  territoire  d'un 
pays.  De  même  pour  d'autres  parties  du  relevé  :  les 
données  résultant  des  documents  groupés  par  les  commis 
des  accises,  celles  réunies  par  les  inspecteurs  du  travail, 
celles  provenant  d'enquêtes  spéciales  seront  mises  à  profit 
pour  évaluer  et  corriger  les  erreurs  toujours  à  craindre 
dans  les  dénombrements  généraux.  De  nombreuses  sources 
peuvent  être  ainsi  consultées  pour  peu  qu'on  y  mette  de 
soin  et  d'ingéniosité.  Nous  supposons  évidemment  que  les 
relevés  à  comparer  portent  sur  les  mêmes  unités  et  aient  été 
exécutées  à  peu  près  à  la  même  époque. 

Un  autre  système  de  vérification  consiste  dans  la  com- 
paraison des  données  numériques  avec  celles  obtenues  an- 
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térieurement.  Il  ne  s'agit  plus  ici  que  de  recueillir  des  in- 
dices généraux  au  sujet  des  lacunes  possibles  du  relevé.  Les 
modifications  trop  profondes,  les  changements  trop 
brusques  feront  l'objet  d'une  étude  spéciale.  Sans  qu'elles 
indiquent  toujours  des  erreurs,  elles  auront  du  moins 
l'avantage  d'attirer  l'attention.  Il  faut  que  l'histoire 
économique  des  années  qui  séparent  les  deux  relevés  four- 
nisse la  justification  théorique  des  modifications  plus  ou 
moins  radicales.  Si  cette  justification  fait  défaut,  ou  si  elle 
est  manifestement  incomplète,  il  y  aura  lieu  d'approfondir 
les  recherches.  Admettons  qu'une  catégorie  d'entreprises 
—  celle  du  vêtement  par  exemple  —  ne  soit  plus  représen- 
tée que  par  un  nombre  beaucoup  moindre  d'ateliers  que  par 
le  passé,  il  y  a  lieu  de  se  demander  si  les  agents  du  dénom- 
brement le  plus  récent  ont  bien  distribué  des  bulletins  à  tous 
les  tailleurs  et  couturières.  Pour  nous> en  rendre  compte, nous 
commençons  par  délimiter  le  champ  des  recherches, puis  nous 
verrons  si  le  nombre  des  ouvriers  des  entreprises  les  plus  im- 
portantes n  'a  pas  augmenté  dans  une  mesure  telle  que  le  fait 
explique  la  disparition  d'une  partie  des  petits  ateliers  ;  nous 
aurons  ensuite  à  nous  demander  s 'il  ne  s 'est  pas  produit  une 
modification  générale  des  procédés  de  travail  (travail  méca- 
nique au  lieu  du  travail  manuel)  ;  nous  irons  même  jusqu'à 
consulter  les  chiffres  du  commerce  international  afin  de  nous 
assurer  si  les  importations  de  vêtements!  n  'ont  pas  augmenté 
dans  une  mesure  qui  explique  la  suppression  d'ateliers 
moins  bien  outillés  que  ceux  des  concurrents  de  l'étranger, 
ou  si  l'explication  ne  doit  pas  être  cherchée  dans  la  réduc- 
tion des  exportations.  Les  procédés  graphiques,  dont  il 
sera  parlé  plus  loin,  jouent  également  un  rôle  intéres- 
sant dans  ce  genre  de  confrontations.  Enfin,  par  la  compa- 
raison des  données  obtenues  pour  les  différentes  localités, 
on  s'assurera  si  l'erreur  est  généralisée  ou  seulement  pro- 
pre à  certaines  divisions  territoriales.  Si  une  erreur  est 
constatée,  les  mesures  voulues  seront  prises  pour  la  faire 
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disparaître,  notamment  en  prescrivant  des  recherches  nou- 
velles accompagnées  d'instructions  complémentaires  dé- 
taillées. 

121.  b)  Recherche  des  multiples  emplois.  —  On  désigne 
sous  le  nom  de  «  double  ou  multiple  emploi  »  le  fait  que  cer- 
taines unités  statistiques  ont  été  comptées  plusieurs  fois  au 
cours  du  relevé.  Certaines-  statistiques  échappent  presque 
entièrement  au  danger  des  doubles  emplois,  d'autres  y  sont 
fort  exposées.  C'est  encore  à  la  statistique  de  l'industrie  — 
l'une  des  plus  difficiles  —  que  nous-  emprunterons  nos 
exemples.  Il  n'y  a  guère  de  danger  qu'une  entreprise  de 
minime  importance  soit  comptée  plusieurs  fois;  le  risque 
se  trouve  plutôt  du  côté  opposé,  c'est-à-dire  qu'elle  ne  soit 
pas  recensée  du  tout  ou  qu'on  lui  attribue  une  qualification 
économique  inexacte,  mais  pour  les  établissements  impor- 
tants, notamment  les  sociétés  anonymes,  les-  comptages  mul- 
tiples sont  à  redouter.  Il  est  assez  fréquent  que  le  chef  d 'un 
établissement  de  l'espèce  n'habite  pas  la  commune  où  sont 
situées  les  usines.  Dans  ce  cas,  s'il  s'agit  d'un  dénombre- 
ment de  personnes,  il  est  compté  dans  la  localité  qu'il  habite 
et  est  invité  à  donner  tous  les  renseignements  touchant  son 
entreprise.  Des  administrateurs  de  la  société  peuvent  se 
croire  obligés  à  fournir  les-  mêmes  données  et  il  en  est  encore 
ainsi  du  directeur  et  des  chefs  de  service.  Il  arrive  que  la 
même  entreprise  soit  recensée  trois  et  quatre  fois.  On  obvie 
au  danger  des  comptages  multiples  en  groupant  tous  les- 
établissements  par  industrie  et  d'après  la  commune  où  ils 
sont  situés.  Les  bulletins  se  rapportant  à  une  même  entre- 
prise s-e  trouvant  ainsi  juxtaposés,  il  est  facile  de  suppri- 
mer ceux  qui  font  double  emploi  en  conservant  »eulement 
celui  dressé  par  la  personne  appelée  réellement  à  répondre. 
On  trouvera  dans-  les  exposés  des  méthodes  suivies  dans  les 
recensements,  de  nombreux  exemples  de  comptages  mul- 
tiples de  ce  genre.  L'un  de  ceux  qui  ont  été  signalés  par  un 
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recensement  récent  (1)  concerne  les  entreprises  commer- 
ciales :  le  cumul,  par  une  seule  personne,  de  plusieurs-  né- 
goces de  minime  importance  ne  justifie  pas  la  création 
d'autant  de  bulletins  séparés,  correspondant  à  des  entre- 
prises distinctes,  non  plus  que  l'exercice  d'une  profession 
pour  le  compte  de  plusieurs  employeurs  ne  doit  pas  avoir 
pour  conséquence  le  comptage,  trois  ou  quatre  fois  répété, 
du  même  individu.  L'organisation  même  du  dépouillement 
—  en  admettant  que  les  bulletins  originaux  soient  transmis 
à  l'organe  central  —  permet  le  plus  souvent  de  faire  dispa- 
raître de  pareilles  causes  d'erreur. 

Un  autre  exemple  de  multiple  emploi  peut  être  trouvé 
dans  les  statistiques  agricoles  à  propos  de  l'étendue  culti- 
vée. Les  indications  des  diverses  cultures  sont  fournies  par 
les  cultivateurs  eux-mêmes  et  consignées  au  bulletin  d 'après 
leurs  indications.  De  nombreuses  erreurs  sont  commises. 
Les  contenances  des  diverses  cultures  sont  indiquées  le  plus 
souvent  de  mémoire  et  en  chiffres  ronds.  Les  cultivateurs 
pourraient  aisément  fournir  des  indications  exactes  en  re- 
courant aux  actes  de  vente  et  de  location,  ou  simplement 
aux  feuilles  de  contribution;  mais  ils  s'en  abstiennent  en 
général  ;  de  plus,  les  terrains  cultivés  sont  souvent  situés  sur 
plusieurs  communes  et  les  délimitations  des  commui  es  ne 
sont  pas  toujours  exactement  connues  des  paysans  qui,  au 
lieu  de  ces  divisions  administratives,  ont  recours  à  des  ap- 
pellations locales.  De  tout  ceci,  il  résulte  que  les  contenances 
indiquées  et  la  répartition  des  terrains  entre  les  diverses 
communes  sont  souvent  fautives.  Il  arrive  que  l'addition 
de  toutes  les  parcelles  déclarées  pour  une  commune  donne 
un  total  supérieur  à  la  superficie  entière  de  la  localité.  C'est 
pour  empêcher  une  erreur  de  ce  genre  que  les  services  de  la 
statistique  agricole  procèdent  à  une  revision  minutieuse  de 
ces  données. 


(1)  Belgique  :  Recensement  de  l'industrie  et  du  commerce  au  31  décem- 
bre 1910.  Vol.  I,  Exposé  des  méthodes,  p.  lxvii. 


I 


CRITIQUE  D'EXACTITUDE  199 

122.  c)  Recherche  des  erreurs  involontaires,  contradic- 
tions, etc.  —  Elle  nécessite  un  examen  minutieux  de  chaque 
bulletin.  D'après  les  instructions  données  aux  agents  recen- 
seurs, ceux-ci  ont  déjà  dû  vérifier  si  chaque  recensé  a  ré- 
pondu à  toutes  les  questions  qui  le  concernent.  Rien  ne  nous 
dit  que  ces  instructions  ont  été  suivies  partout.  Une  revision 
effectuée  sur  le  matériel  même  s'impose  avant  de  pas-ser  à 
d'autres  phases  du  travail  statistique.  La  difficulté  de  cette 
recherche  est  allégée  dans  une  certaine  mesure  quand  î  'exa- 
men porte  successivement  sur  les  points  suivants  :  1°  l'au- 
teur du  document  a-i-il  répondu  à  la  question?  Les  lacunes 
sont  extrêmement  fréquentes  dans  un  matériel  étendu.  On 
demande  d'indiquer  la  profession  principale  et  séparément 
la  profession  secondaire  :  cette  dernière  est  souvent  omise. 
On  s 'mf orme  des  spécialités  professionnelles  :  le  recensé  ne 
répond  pas  à  la  question,  ou  il  y  répond  en  termes  vagues  qui 
n'apportent  aucun  éclaircissement.  Des  gérants  d'établis- 
sements commerciaux  négligent  de  mentionner  le  nom  de  la 
personne  ou  de  la  société  pour  le  compte  de  laquelle  ils 
gèrent  cette  subdivision  d'entreprise.  Dans  les  registres  des 
sociétés  d'assurance  contre  les  accidents,  on  omet  parfois 
l'indication  des  frais  de  maladie  ou  la  durée  de  l'incarjacité 
subie,  etc.  Une  lacune  de  l'espèce  doit  être  complétée  à  j  'aide 
des  renseignements  recueillis  au  cours  de  recherches  com- 
plémentaires. 

123.  2°  L'auteur  du  document  a-t-il  compris  la  question? 
Malgré  tous  les  soins  apportés  à  la  rédaction  du  bul- 
letin, de  fréquentes  erreurs  proviennent  de  ce  fait.  Les 
unes  sont  dues  à  l'ignorance,  les  autres  au  manque 
de  réflexion,  d'autres  encore  au  fait  que  la  termi- 
nologie du  document  n'est  pas  comprise.  Lorsqu'on  s'en- 
quiert  auprès  d'un  ouvrier  s'il  rentre  dans  la  catégorie 
des  ouvriers  à  domicile,  a-t-il  saisi  exactement  ce  qu'on  en- 
tend par  cette  expression  :  «  ouvrier  à  domicile  »?  Le  bul- 
letin français,  au  lieu  de  cette  expression,  emploie  celle 
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d'ouvrier  à  façon  travaillant  à  domicile  :  le  saisit-on 
toujours  bien  ?  Les  recensements  professionnels  distin- 
guent entre  ((  profession  principale  »  et  «  profession 
accessoire  ».  Quand  une  occupation  supplémentaire  devient- 
elle  une  «  profession  accessoire  »  ?  Et  de  deux  professions 
exercées  par  la  même  personne,  laquelle  doit  être  qualifiée 
d'accessoire?  Les  instructions  précisent,  autant  qu'il  se 
peut,  ces  divers  points  ;  seulement,  il  est  permis  de  se  deman- 
der si  elles  ont  été  lues  et  surtout  comprises. 

124.  Pour  éviter  ces  erreurs  ou  pour  les  reconnaître,  si, 
malgré  tout,  elles  se  produisent,  on  a  recours  à  des  «  ques- 
tions de  contrôle  ».  Ainsi,  après  avoir  réservé  une  pariée  du 
bulletin  individuel  à  l'inscription  de  la  profession  et  de  la 
qualité  d'ouvrier,  on  ajoute:  «  pour  qui  travaillez-vous?  » 
Les  petits  patrons  qui  auraient  utilisé  mal  à  propos  cette 
partie  du  bulletin,  s'empresseront  de  répondre  :  «  pour  les 
personnes  de  la  localité  ou  des  alentours  »,  mais  sans  dési- 
gner nominativement  un  patron  qui  les  aurait  fait  travail- 
ler. Cette  circonstance  suffit,  le  plus  souvent,  à  les  faire 
classer  dans  la  catégorie  des  chefs  d'entreprise.  D'autre 
part,  on  a  délimité  dans  la  plupart  des  pays  la  sphère  éco- 
nomique de  l'industrie  à  domicile;  rien  de  plus  simple  que 
d'éliminer  de  la  catégorie  des  ouvriers  à  domicile  une  série 
de  professions  qui,  de  toute  évidence,  n'appartiennent  pas 
à  la  production  décentralisée.  Dans  un  recensement  com- 
mercial, il  y  a  lieu  de  s'informer  si  une  exploitation  indus- 
trielle n'est  pas  jointe  à  l'exercice  du  commerce  :  ainsi, 
après  s'être  informé  du  commerce,  on  posera  la  question 
suivante  :  «  fabrique-t-on  chez  vous,  ou  faites-vous  fabri- 
quer au  dehors  par  des  ouvriers  travaillant  pour  votre 
compte,  certaines  marchandises  que  vous  vendez?  »  et  l'on 
ajoute  immédiatement  la  question  de  contrôle  :  «  si  oui, 
avez-vous  rempli  le  bulletin  relatif  à  cette  fabrication?  » 
L'usage  des  questions  de  contrôle  est  fort  étendu.  Il  suffira 
de  ces  exemples  pour  donner  une  idée  de  leur  nature. 
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L'étendue  des  opérations  de  revision  ressort  des  chiffres 
suivants  :  en  Belgique,  en  1910,  le  service  du  recensement 
de  l'industrie  et  du  commerce  a  annulé  95,000  bulletins  et 
renvoyé  pour  correction  aux  agents  recenseurs  383,000  bul- 
letins sur  un  total  de  2,130,000.  Cette  revision  eût  été  impos- 
sible si  les  bulletins  n'avaient  pas  été  communiqués  dans 
leur  forme  originale,  à  l'organe  central  du  recensement.  Ce 
fait,  mieux  que  tout  autre,  montre  l'importance  de  la  cen- 
tralisation complète  de  tous  les  travaux  de  critique  et  de  dé- 
pouillement. 

125.  Les  procédés  de  revision  dépendent  en  premier  lieu 
de  l'organisation  administrative  du  service  central.  Us  sont 
donc  susceptibles  de  prendre  diverses  formes.  Pour  ne  pas 
se  borner  à  cette  simple  constatation, indiquons  quelques-uns 
de  ces  procédés,  sans  prétendre  le  moins  du  monde  qu  'il  n  'en 
existe  pas  d'autres.  En  premier  lieu,  beaucoup  d'erreurs 
relevées  par  la  critique  d'exactitude  sont  de  nature  à  être 
corrigées  immédiatement,  à  la  simple  lecture  du  bulletin. 
Si  les  erreurs  ont  échappé  à  l'agent  recenseur,  elles  seront 
relevées  par  l'organe  central.  Telles  sont  celles  qui  résul- 
tent à  l'évidence  des  réponses  données  aux  questions  de  con- 
trôle. Ces  corrections  sont  appelées  «  corrections  d'office  ». 

Pour  les  recherches  complémentaires,  ayant  pour  but  de 
faire  disparaître  les  lacunes  des  bulletins,  il  faut  s'adresser 
aux  agents  recenseurs  eux-mêmes.  Leur  mission  n'a  pas  été 
remplie  par  eux  avec  tout  le  soin  désirable  ;  il  leur  incombe 
de  faire  compléter  les  bulletins  en  les  représentant  de  nou- 
veau aux  recensés,  à  leur  domicile.  C'est  seulement  après 
vérification  des  réponses  complémentaires  qu'il  sera  oppor- 
tun de  liquider  les  indemnités  attribuées  aux  agents  recen- 
seurs. 

Les  difficultés  sont-elles  plus  sérieuses  et  faut-il  procé- 
der à  une  vérification  plus  approfondie?  Il  n'est  guère  à 
recommander  de  s'adresser  aux  agents  recenseurs  eux- 
mêmes.  L'organe  central  a  le  choix  entre  deux  moyens  : 
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s'adresser,  par  correspondance,  aux  recensés,  ou  aux 
organes  du  relevé  automatique  s'il  s'agit  d'une  opé- 
ration de  l'espèce.  Actuellement, le  développement  du  réseau 
téléphonique  offre  des  facilités  qui  n'existaient  pas  il  y  a 
quelques  années.  L'organe  central  peut  aussi  envoyer  en 
mission  des  délégués  spéciaux  lorsqu'il  s'agit  de  données 
délicates  à  recueillir  d'après  un  plan  uniforme.  Le  vaste 
recensement  des  salaires  compris  dans  le  recensement 
belge  de  1896  a  été  exécuté  presque  tout  entier  d'après  cette 
méthode. 

II.  —  Vérification  externe. 

126.  De  la  vérification  externe  il  y  a  peu  de  chose  à  dire  ; 
il  suffit  presque  de  la  définir.  Elle  consiste  à  s'assurer  de 
l'exactitude  des  calculs,  des  résultats  partiels  et  globaux 
qui  représentent  l'aspect  quantitatif  des  phénomènes. 

Considérés  avec  attention,  les  chiffres  peuvent  mettre 
sur  la  piste  de  quelque  erreur  restée  jusque-là  inaperçue  ; 
l'examen  auquel  on  les  soumet  est  une  partie  de  la  vérifica- 
tion externe,  celle  qui  touche  le  plus  près  à  la  critique.  Si 
l'on  donne  un  peu  d'extension  au  terme  «  critique  »,  on 
comprendra  également  sous  cette  dénomination  toutes  les 
investigations  qui,  par  leur  nature,  peuvent  conduire  à  des 
résultats  plus  exacts.  C'est  à  ce  titre  que  les  vérifications 
portant  sur  les  calculs  et  sur  l'exactitude  de  la  reproduction 
typographique  appartiennent  à  la  critique  externe. 

Encore  qu'il  ne  s'agisse  que  d'un  travail  matériel,  cette 
besogne  n'est  pas  indigne  d'occuper  le  statisticien.  Tout  le 
travail  antérieur  vient  comme  se  cristalliser  dans  un  nom- 
bre. N'est-il  pas,  dès  lors,  d'une  grande  importance  que  ce 
nombre  soit  correctement  calculé  et  exactement  reproduit? 
Malgré  l'indulgence  qu'il  convient  d'apporter  dans  l'appré- 
ciation des  fautes  matérielles  quand  la  méthode  générale 
est  bonne,  on  ne  peut  se  défendre  d'un  malaise  réel  lorsque 
les  résultats  numériques  sont  entachés  de  quelque  inexacti- 
tude. Ce  sont  là  des  verrues  très  déplaisantes  sur  un  beau 
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visage.  On  ne  peut,  sans  doute,  les  éviter  tout  à  fait;  au 
moins,  faut-il  les  redouter  et  agir  en  conséquence. 

CHAPITRE  IV 
Précision  des  résultats 

127.  L'école  mathématique  groupe  sous  l'appellation  de 
«  accuracy  »  (précision),  l'ensemble  des  procédés  à  l'aide 
desquel  l'exactitude  d'un  relevé  peut  être  exprimée,  quand 
on  le  compare  à  un  autre.  Elle  a  recours  aux  mathématiques 
pour  calculer  l'effet  que  plusieurs  erreurs  peuvent  pro- 
duire, lorsqu'elles  sont  additionnées,  multipliées  ou  divi- 
sées entre  elles.  Elle  joint  généralement  à  cet  exposé  les  pro- 
cédés de  réduction  de&  nombres  en  chiffres  ronds,  —  le  but 
de  cette  réduction  étant  de  ne  pas  donner  aux  résultats  du 
relevé  une  précision  plus  grande  que  celle  qui  peut  leur  être 
légitimement  attribuée. 

Cette  matière  peut  être  exposée  à  la  suite  de  la  critique 
statistique,  dont  elle  forme  comme  la  conclusion  :  c'est  pour 
cette  raison  que  nous  la  comprenons  dans  la  section  II  de 
cet  ouvrage.  M.  Bowley  définit  ainsi  la  règle  fondamentale 
de  la  recherche  de  la  précision,  autrement  dit  le  calcul  de 
l'importance  des  erreurs  :  «  l'erreur,  dans  une  observation 
approchée  (an  estimate)  est  le  rapport  de  la  différence  entre 
cette  observation  et  la  valeur  véritable  à  l'observation  ap- 
prochée (1)  ».  M.  Bowley  continue  :  Représentons  par  u  la 
mesure  d'une  certaine  quantité,  sachant  que  la  valeur  véri- 
table de  cette  quantité  est  u1  ;  l'erreur  dans  l'estimation  ap- 
prochée —  à  laquelle  nous  donnerons  la  désignation  de  e, 

est  donc  :  u1  —  u 

e=—^-  (A) 

et  m1  =  u  (1  +  e) 

La  réciproque  de  est  une  mesure  appropriée  de  la 

précis-ion  d'une  observation  approchée,  et  cette  mesure  dé- 


fi) Bowley  (A.),  Eléments  of  statistics.  London,  1902,  p.  201. 
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vient  infinie  lorsque  l'erreur  est  zéro  (1).  On  voit  immédia- 
tement que  cette  notion  implique  l'existence  d'une  mesure 
exacte,  à  laquelle  on  peut  rapporter  une  observation  du 
même  fait,  soupçonnée  de  renfermer  une  erreur  d'une  im- 
portance inconnue.  La  logique  nous  avertit  suffisamment 
d'ailleurs  que,  pour  évaluer  l'erreur  d'un  relevé,  il  est  de 
toute  nécessité  qu'on  puisse  trouver  un  point  de  comparai- 
son en  dehors,  supposé  plus  exact  que  le  relevé  lui-même. 
Nous  avons  donc  à  nous  demander  dans  quels-  cas  et  sous 
quelles  conditions  il  sera  possible  de  déterminer  ce  point 
de  comparaison. 

128.  Quand  on  veut  calculer  le  degré  de  précision  des  ob- 
servations faites  dans  le  domaine  des  sciences  physiques, 
les  procédés  de  calcul  indiqués  par  l'école  mathématique 
s'appliquent  sans  difficulté  parce  que,  dans  ce  domaine,  on 
dispose  généralement  d'un  modèle  auquel  on  peut  comparer 
les  résultats  qui  n'en  sont  que  des  copies  plus  ou  moins  ap- 
prochées (2). 

Dans  ce  cas,  rien  de  plus  simple  que  le  calcul  de  l'erreur 
commise  dans  la  copie. 

Mais  en  statistique,  disposons-nous  de  ces  mesures-types 


(1)  Pour  la  démonstration  de  cette  formule,  cfr.  Bowley  :  «  Relations 
between  the  Aceuracy  of  an  Average  and  tliat  of  its  Constituent  Parts  ». 
(Journal  of  the  Roy.  Statistical  Society,  1897;  p.  855.) 

(2)  En  métrologie,  par  exemple,  on  dispose  de  mesures  de  longueur  ou 
de  poids  ou  de  contenance  construites  avec  la  dernière  précision.  Il  existe, 
dans  tous  les  pays,  des  mètres-étalons  en  platine,  gradués  avec  un  soin 
extrême,  jusqu'à  donner  l'appréciation  du  micron  ;  ces  mesures-types  con- 
servées dans  des  conditions  qui  les  mettent  à  l'abri  de  toute  altération, 
forment  une  base  immuable  à  laquelle  on  rapporte  les  instruments  de  mesure 
moins  parfaits  construits  à  l'usage  du  commerce.  Supposez  que  ce  mètre- 
étalon  n'existe  pas,  il  ne  faudrait  pas  longtemps  pour  que,  de  dégradation  en 
dégradation,  l'unité  métrique  usuelle  s'écarte  sensiblement  de  la  longueur 
théorique  qu'elle  est  censée  représenter.  On  aurait  ainsi  des  mètres  trop 
longs  et,  sans  doute,  un  plus  grand  nombre  de  mètres  trop  courts.  Les 
transactions  en  seraient  profondément  troublées  et  de  nombreuses  contes- 
tations ne  tarderaient  pas  à  s'élever.  Elles  seraient  insolubles,  faute  d'un 
type  auquel  on  pourrait  comparer  les  diverses  mesures  obtenues. 
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auxquelles  nous  puissions  comparer  nos  relevés!  Avons- 
nous  la  possibilité  de  constater  nos  erreurs  accidentelles  et 
d'en  déterminer  le  quantum? 

Il  est  clair  que  s'il  s'agit  de  phénomènes  physiques  obser- 
vés dans  des  conditions  douteuses,  on  pourra  presque  tou- 
jours comparer  ces  observations  à  des  mensurations  plus 
rigoureuses  de  façon  à  en  déterminer  le  coefficient  d'er- 
reur (1). 

Mais,  ce  n'est  pas  dans  ce  domaine  que  se  groupent  les 
recherches  usuelles  de  la  statistique.  Elles  ont  trait,  le  plus 
souvent,  à  des  phénomènes  sociaux  ou  à  des  faits  matériels 
ayant  des  rapports  étroits  avec  les  phénomènes  sociaux. 

L'état  de  la  population  est  un  phénomène  social  :  état 
quantitatif,  c'est-à-dire  le  relevé  du  nombre  des  citoyens 
d'une  ville,  d'une  province,  d'un  royaume;  —  état  quali- 
tatif, c'est-à-dire  les  attributs  de  telle  population  :  nombre 
de  personnes  célibataires,  mariées,  veuves,  divorcées  ;  nom- 
bre d'agriculteurs,  de  commerçants,  d'industriels,  de  per- 
sonnes sans  profession.  La  richesse  publique  et  privée  est 
un  phénomène  social  par  connexité  aux  activités  sociales 
dont  il  dérive  :  les  activités  sociales  sont  les  facteurs  de  la 
richesse,  l'estimation  de  celle-ci,  indépendamment  de  l'inté- 
rêt qu'elle  présente  par  elle-même,  nous  fait  donc  connaître 
l'intensité  des  activités  sociales  qui  la  produisent.  Dans  ce 
domaine  traditionnel  de  la  statistique,  nous  croyons  que  les 
méthodes  de  comparaison  signalées  en  vue  d'établir  le  de- 
gré de  précision  du  relevé,  sont  souvent  inapplicables  ou 
inopérantes.  C  'est  que  les  opérations  du  relevé,  lentes,  péni- 
bles et  coûteuses,  ne  se  renouvellent  pas  par  pur  dillettan- 
tisme  scientifique.  Si  l'on  a  un  relevé  idéal,  parfait  au  point 
qu'on  puisse  déterminer  les  erreurs  de  tous  les  autres  en 
les  comparant  simplement  au  premier,  il  ne  viendra  à  l'es- 


(1)  Par  exemple,  le  comparateur  utilisé  au  Bureau  international  des  poids 
et  mesures,  à  Passy,  est  un  instrument  d'une  justesse  extrême  à  l'aide  duquel 
on  peut  vérifier  avec  la  plus  grande  précision  les  variations  des  étalons 
métriques  secondaires  par  rapport  à  l'étalon-type. 
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prit  de  personne  de  réclamer  l'exécution  d'une  statistique 
qui,  par  définition,  serait  moins  exacte  que  la  première.  Et 
si  de  deux  relevés  coexistants  il  est  prouvé  que  l'un  l'em- 
porte sur  l'autre,  on  n'aura  guère  besoin  de  recourir  à  des 
procédés  de  comparaison  numérique,  car  les  résultats  du 
second  seront  laissés  dans  l'oubli  du  moment  qu'il  sera 
prouvé  que  leur  valeur  est  inférieure.  En  résumé,  c'est  le 
point  de  comparaison  qui  fait  défaut  dans  la  plupart  des 
cas:  si  l'on  avait  un  relevé  parfait,  on  n'aurait  nul  besoin 
et  nulle  envie  d'en  exécuter  un  autre. 

Il  en  va  autrement  dans  les  sciences  appliquées.  Là,  on 
possède  une  mesure-type  dont  toutes  les  autres  ne  sont  que 
des  copies  plus  ou  moins  réussies,  des  reproductions  plus 
ou  moins  altérées.  Il  y  a  un  mètre-étalon  ;  il  y  a  des  milliers 
de  mètres  en  métal,  en  bois,  en  tissu,  qui  servent  aux  besoins 
de  la  vie  journalière.  On  peut  toujours  comparer  ces  copies 
à  la  mesure-étalon  et  on  doit  le  faire  pour  éviter  de  grands 
inconvénients. 

Aussi,  les  hypothèses  dont  M.  Bowley  se  sert,  rendent 
bien  évidente  la  distinction  ci-dessus.  Supposons,  dit-il, 
qu'un  relevé  statistique  nous  donne  ce  résultat  que  le  salaire 
hebdomadaire  d'ouvriers  agricoles  soit  de  13  s.  et  que  nous 
sachions  qu'en  réalité  le  salaire  de  ces  ouvriers  agricoles  est 
de  14  s.,  nous  avons  : 


quotité  représentant  l'erreur  du  relevé  fautif  comparé  au 
relevé  exact  (1).  Mais  pour  comparer  ces  deux  données  il 
est  nécessaire  que  nous  sachions  quelle  est  la  réalité  oppo- 
sée à  l'approximation;  telle  est  précisément  toute  la  ques- 
tion. Comment  connaître  cette  réalité,  comment  arriver  à 
cette  notion  sinon  parfaite,  du  moins  plus  exacte  que  l'esti- 
mation jugée  par  nous  inférieure  en  précision? 


14  —  13 
13 


=  ^  ou  7,7  °/< 


(1)  Bowley  (A.-L.),  Eléments  of  statistics.  London,  2e  édition,  1902, 
p.  201. 
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•  129.  Ne  nous  attendons  pas  à  la  rencontrer  souvent,  mais 
enfin  elle  existe  dans  certains  cas,  et  si  peu  nombreux  qu'ils 
soient  ils  suffisent  à  justifier  théoriquement  l'application 
du  calcul  aux  phénomènes  réunissant  les  conditions  néces- 
saires. En  voici  un  exemple  basé  sur  la  méthode  générale 
exprimée  dans  la  définition  de  l'erreur  donnée  par  M.  Bow- 
ley,  et  que  nous  avons  reproduite  plus  haut. 

Les  dénombrements  de  personnes  sont  rarement  compa- 
rables à  d'autres  relevés  du  même  genre,  portant  sur  les 
mêmes  unités,  effectués  au  même  moment,  deux  relevés 
simultanés  n  'étant  exécutés  que  dans  des  cas  exceptionnels. 
Cependant,  ce  cas  général  comporte  parfois  l'une  ou  l'autre 
exception.  En  voici  une  :  le  compte  rendu  des  opérations 
des  chemins  de  fer  de  l'Etat  belge,  qui  paraît  chaque  année, 
renferme  la  statistique  des  ouvriers  appartenant  à  l'admi- 
nistration. En  1910,  au  31  décembre,  le  nombre  de  ces  ou  - 
vriers était  de  55,600  (1).  A  la  même  date,  avait  lieu  en  Bel- 
gique le  recensement  général  de  l'industrie  et  du  commerce 
qui,  au  moyen  de  bulletins  individuels,  relevait  le  nombre 
des  exploitants,  employés  et  ouvriers  occupés  en  Belgique. 
Les  cadres  statistiques  réservaient  une  place  spéciale  au 
dénombrement  du  personnel  actif  des  chemins  de  fer  de 
l'Etat;  en  y  comprenant  598  chômeurs,  évidemment  portés 
sur  les  listes  dressées  par  l'administration  des  chemins  de 
fer,  le  relevé  statistique  de  1910  donne  un  total  de  56,046  ou- 
vriers (2). 

D 'après  ce  qui  précède,  en  admettant  comme  exact  le  chif- 
fre donné  par  l'administration  des  chemins  de  fer  de  l'Etat, 
on  a  la  fraction  : 

55,600  —  56,046        446  223        n  nn  n 

 Kt-  an-   =  Kn  ,,/,.  ou  -  OU  0,0079. 

ôb,04b  56,046  28,023 


(1)  Chemins  de  fer  de  l'Etat  belge.  Compte  rendu  des  opérations  pendant 
Tannée  1910.  Rapport  présenté  aux  Chambres  législatives  :  Chambre  des 
Représentants,  n°  177.  Bruxelles  1911,  A,  p.  8. 

(2)  Ministère  de  l'Industrie  et  du  Travail.  Office  du  Travail.  Recensement 
de  l'industrie  et  du  commerce,  recensement  professionnel;  t.  IL  Bruxelles, 
1913,  p.  1414,  col.  13  et  19. 


208 


PRINCIPES  DE  STATISTIQUE 


La  supposition  que  le  chiffre  donné  par  l'administration 
des  chemins  de  fer  de  l'Etat  représente  exactement  le  nom- 
bre des  ouvriers  est  une  hypothèse  assez  gratuite  :  dans  un 
comptage  qui  introduit  une  distinction  aussi  délicate  que 
celle  d'employés  et  d'ouvriers,  rien  de  plus  facile  que  de 
commettre  une  erreur.  Aussi,  serait-il  plus  prudent  d'ac- 
corder une  égale  valeur  aux  résultats  en  présence  et  de  con- 
sidérer l'écart  qu'ils  présentent  comme  une  simple  discor- 
dance et  non  comme  une  erreur  à  imputer  à  l'un  des  relevés 
plutôt  qu'à  l'autre.  Dans  ce  cas,  la  fraction  devrait  s'écrire  : 

130.  Mais  de  tels  exemples  sont  rares;  toute  comparai- 
son statistique  suppose  en  effet  que  l'unité  soit  la  même  de 
part  et  d'autre.  Cette  condition  n'est  pas  toujours  réalisée. 
Dans  deux  opérations  statistiques  exécutées  par  des  orga- 
nismes indépendants,  les  définitions  des  unités  seront  rare- 
ment concordantes.  La  statistique  du  chômage, par  exemple, 
présente  un  cas  de  l'espèce.  Un  relevé  du  chômage  effectué 
lors  d'un  recensement  général  nous  paraît  suspect.  La  pen- 
sée nous  vient  naturellement  de  prendre  pour  point  de  com- 
paraison, en  lui  attribuant  une  valeur  plus  grande  qu'à 
notre  dénombrement,  le  relevé  des  chômeurs  dressé  par  un 
certain  nombre  de  syndicats  ouvriers.  Il  est  raisonnable  de 
penser  que  les  listes  de  chômeurs  dressées  par  ces  syndicats 
sont  plus  exactes  que  toute  autre,  attendu  que  des  indemni- 
tés journalières  sont  accordées  aux  syndiqués  sans  travail 
et  que,  dès  lors,  une  comptabilité  régulière  s'impose.  Mais 
les  définitions  du  chômeur  ne  concordent  pas  en  fait.  Les 
syndicats  ne  connaissent  que  le  chômeur  indemnisé  et 
comme  le  droit  à  l'indemnisation  cesse  après  un  certain 
temps,  il  arrive,  pendant  les  périodes  de  crise  industrielle, 
que  les  syndicats  comptent  un  assez  grand  nombre  de  chô- 
meurs qui  ont  épuisé  leurs  droits  aux  allocations  de  chô- 
mage; d'autre  part,  le  chômage  est  généralement  plus 
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étendu  parmi  les  non-syndiqués  que  parmi  les  syndiqués.  11 
est  donc  impossible,  en  s 'appuyant  sur  des  documents  de 
l'espèce,  de  découvrir  et  de  mesurer  l'erreur  qu'un  relevé 
général  pourrait  présenter. 

(  )n  ne  peut  non  plus  comparer  une  moyenne  à  un  chiffre 
obtenu  directement  par  l'observation  statistique.  A  une 
date  déterminée  on  relève  la  population  ouvrière  indus- 
trielle d'un  pays  et  on  trouve  qu'elle  s'élève,  dans  les  mines 
de  houille,  à  147,000  personnes.  L'administration  des  mines, 
de  son  côté,  publie  la  statistique  de  la  population  ouvrière  : 
elle  se  borne  à  une  moyenne  analogue  à  celle  du  calcul  du 
vollarbeiter,  c'est-à-dire  qu'ayant  relevé  le  nombre  de  jour- 
nées de  travail  elle  divise  ce  nombre  par  le  chiffre  de  300 
(nombre  conventionnel  des  journées  d'activité  en  un  an)  :  le 
quotient  —  dans  le  pays  dont  il  s'agit  —  donne  143,000.  On 
ne  comparera  pas  les  deux  nombres  parce  qu'ils  sont  obte- 
nus par  des  méthodes  différentes  et  ne  représentent  pas  la 
même  chose. 

131.  Il  arrive  assez  souvent  que  les  données  relatives 
aux  choses  fournissent  plusieurs  points  de  comparaison 
utilisables;  les  choses  matérielles  intéressent  souvent  plu- 
sieurs services  chargés  de  la  statistique,  de  sorte  qu'on  pos- 
sède des  données  recueillies  de  divers  côtés.  Ces  évaluations 
ne  sont  pas  généralement  concordantes,  même  quand  elles 
s'appliquent  à  un  objet  parfaitement  défini,  tel  que,  par 
exemple,  la  superficie  d'un  pays.  Voici  quelques  chiffres 
montrant  ces  variantes,  en  ce  qui  concerne  la  superficie  de 
la  Belgique  : 

Superficie,  en  hectares,  de  la  Belgique 

A.  D'après  la  statistique  des  biens  de  mainmorte  (1866),  2,045,516  hectares 

B.  D'après  le  recensement  général  de  la  popuIation(18S0),  2,045,715  hectares. 

C.  D'après  le  recensement  général  de  l'agriculture  (1880),  2,045,589  hectares. 

D.  D'après  le  recensement  général  de  l'agriculture  (1805),  2,045,557  hectares. 

E.  D'après  le  recensement  général  de  la  population  (1900),  2,045.503  hectares. 
Pi  D'après  le  recensement  général  de  la  population  (1910),  2,945,104  hectares. 
G.  D'après  le  recensement  général  de  l'agriculture  (1910),  2.045,040  hectares. 
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La  discordance  entre  les  divers  résultats  tient  à  diverses 
causes  qu'il  est  inutile  de  •rechercher  ici.  Pour  les  chiffres 
de  deux  recensements,  ceux  de  1900  et  de  1910,  par  exemple, 
la  différence  s'exprimera  par  la  fraction  : 

2,945,503  —  2  945.104 
2,945,104 

précédée  du  signe  ±  s'il  n'y  a  pas  de  bonnes  raisons  pour 
préférer  les  données  de  l'un  aux  données  de  l'autre.  Si  l'on 
possédait  un  relevé  présentant  plus  de  garanties,  on  pour- 
rait utilement  lui  comparer  les  données  de  l 'un  et  de  l 'autre 
recensement  en  faisant  cette  fois  précéder  la  simplification 
de  la  fraction  des  signes  -j-  ou  —  selon  les  cas*. 

Les  résultats  consignés  plus  haut  sont  une  illustration  de 
la  règle  générale  d'après  laquelle  les  différences  très  mi- 
nimes peuvent  être  négligées  s'il  ne  s'agit  pas  d'une  des- 
cription purement  scientifique  portant  sur  des  mesures 
extrêmement  précises.  On  peut,  hormis  ce  cas,  remplacer 
deux  ou  trois  rangées  de  chiffres  par  des  zéros,  ou  trans- 
former ces  trois  rangées  de  chiffres  en  un  chiffre  rond  à 
ajouter  aux  tranches  précédentes,  en  la  faisant  précéder 
du  signe  ±  ;  ainsi,  dans  l'exemple  donné  sub  litt.  E,  on 
écrira  plus  exactement  le  résultat  relatif  à  l'année  1900, 
comme  ceci  :  2,945,000  ±  500. 

132.  Pour  terminer  cette  matière  de  la  précision  des  ob- 
servations, il  y  a  lieu  d'examiner  l'effet  que  plusieurs  er- 
reurs peuvent  produire  lorsqu'elles  sont  additionnées,  mul- 
tipliées ou  divisées  entre  elles.  Nous  formulons  ci-après  les 
règles  du  calcul  en  suivant  les  formules  données  à  cet  effet 
par  les  auteurs  appartenant  à  l'école  mathématique,  mais 
en  nous  limitant  à  l'addition  et  au  calcul  des  moyennes 
arithmétiques  simples  qui  sont  les  cas  les  plus  fréquents. 

((  L'erreur  dans  un  total  d'observations,  dit  M.  Bowley, 
est  égale  à  la  somme  des  erreurs  des  facteurs  quand  chacune 
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est  multipliée  par  le  rapport  de  la  partie  correspondante  au 
total.  »  M.  Bowley  expose  ainsi  la  formule  (1)  : 

Soit  u  quantités  telles  que  ux,  n2,  ....  Un  dont  le  total  est  désigné 
par  la  lettre  u,  de  sorte  que  u  est  égal  à  ux  -f-  n2  +  ...un  •  Appelons  e  la 
somme  des  erreurs  de  ces  quantités,  erreurs  désignées  par  elt  e2....  en. 
La  valeur  véritable  du  total  est  u  (1  -f-  e)  et  les  valeurs  véritables  de 
chaque  partie  composant  le  total  est  u{  (1  +  e^,  u2  (i  +  e2)  ....  un 
(i  +  fn) 

donc  : 

u  (1  +  e)  =  m,  (1  +  etj  -f  u.2  (1  +  e2)  +  u3  (1  +  e3)  4-  

Mais  nous  avons  défini 

«  =  «1  4-  u2  +  ..  .  W„ 
d'où,  par  soustraction,  nous  avons 

ite  =         4-  w2  e2  +   

et 

.-«,x§.+.%;4  *+•.<•  (5) 

Al.  Bowley  donne  l'exemple  suivant  comme  application 
arithmétique  :  2  Trades  Unions  indiquent  respectivement 
555  et  45  membres  sans  travail  alors  que  les  chiffres  véri- 
tables sont  565  et  50,  de  sorte  que  les  erreurs-  sont  : 


D'après  la  régie  ci-dessus,  l'erreur  dans  le  total  est  : 

2    .  555  ,    1  .    4'5  \ 
mde6ÛU  +  9de6ÔÔ  =  40°u24/2p-  C- 

Si  l'on  fait  la  moyenne  de  xjlusieurs  observations  appro- 
chées, l'erreur  de  la  moyenne  est  la  somme  des  observations 
particulières  quand  chacune  de  ces  erreurs  est  multipliée 
par  le  rapport  de  l'estimation  correspondant  à  celui  du 


(1)  Bowley  (Arthur  L.),  Eléments  of  siatistics,  London,  1902,  p.  203. 
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total  des  estimations'.  La  formule  se  déduit  facilement  de  la 
précédente.  Elle  est  ainsi  donnée  par  M.  Bowley  : 

Soient  les  estimations  m1(  m2  ...  mn  de  quantités  affectées  d'une 
certaine  erreur  eit  e.2,  ...  en,  de  sorte  que  leur  valeur  véritable  est 
vtki  il  4-  éi),  vm  (1  +  e8), 

la  moyenne  des  estimations  est  évidemment  : 

Mlj  +  "'2  +  î»„ 

n 

{n  désignant  le  nombre  de  termes  ) 

et  la  moyenne  des  valeurs  exactes  est  : 

<M  4  >»8  (  I  +  ei,  +  w»„  (1  4-  g») 

»i 

L'erreur  de  la  moyenne,  d'après  la  règle  ci-dessus,  est  : 

vii    +     +  ft»g  (1  4  et)         _  nij  4-  m9_ 

n  ""  n  _    wij  4-g8.w»2  i 

jHj_|_m2  ~~  m1  +  m2 

=  e<  x  — ^-  -f  f2  X  — -  +••• 
—  désignant  la  somme  des  /». 

On  trouvera  notamment  dans  Bowley  des  règles  appli- 
cables aux  multiplications,  divisions,  moyenne  pondé- 
rée, etc.  que  nous  omettons  ici,  les  cas  d'application  étant 
beaucoup  plus  rares  qu'en  ce  qui  concerne  les  formules  pré- 
cédentes 

133.  Afin  de  ne  pas  citer  des  nombres  compliqués  dans 
les  exposés  des  résultats  statistiques,  on  simplifie  souvent 
les  chiffres  en  ne  citant  que  les  données  caractéristiques. 
Au  lieu  de  dire  :  «  telle  ville  compte  102,021  habitants  »,  on 
écrira  simplement  :  102,000  habitants.  Les  simplifications 
de  ce  genre  conviennent  particulièrement  aux  exposés  ré- 
digés en  vue  du  grand  public  ou  ayant  un  but  didactique. 
Elles  sont  imposées  également  en  vertu  des  principes  rap- 
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pelés  plus  haut  ayant  trait  à  la  précision  des  données  numé- 
riques. On  ne  doit  pourtant  y  recourir  qu'avec  discrétion  à 
cause  des  difficultés  qui  résultent  de  leur  comparaison  avec 
les  données  numériques  plus  précises  qu'on  rencontre  dans 
les  tableaux  de  chiffres  :  lorsque  le  chercheur  veut  recon- 
stituer un  nombre  par  addition  successive  de  ses  facteurs  il 
peut  éprouver  des  hésitations  s'il  compare  ces  résultats  aux 
nombres  simplifiés.  -Pour  simplifier  les  chiffres  on  suit  des 
règles  précises  dont  la  plus  essentielle  est  de  s'arrêter  au 
dernier  chiffre  dont  la  précision  puisse  être  garantie.  Si  ce 
chiffre  est  la  première  décimale  de  chaque  nombre,  on  se 
bornera  à  écrire  le  nombre  entier  avec  la  première  décimale 
en  ((  forçant  »  ce  chiffre  s'il  dépasse  5  ou  si  le  chiffre  dont 
il  s'agit  est  égal  à  5  et  est  suivi  lui-même  de  chiffres  supé- 
rieurs à  0.  Les  exemples-  suivants  précisent  ce  qui  précède  : 

28.94103  se  simplifie  à  la  première  décimale  en  28.9 
32.95140  »        »  »  »        »  33.0 

19.90200  »        »  »  »        »  19.9 

27.05683  »        »  »  »        »  27.1 

23.04999  »        »  »  »        »  23.0 

36.05001  ))        »  »  »        )>  36.1 

Si  tous  les  chiffres  sont  corrects  et  si  leur  exactitude  est 
démontrée,  il  vaut  mieux  citer  l'expression  fractionnaire 
que  d'arrondir.  Une  règle  métallique  bien  construite  me- 
sure 7  m.  255  millimètres;  il  est  préférable  de  citer  ce  nom- 
bre, dont  nous  supposons  l'exactitude  parfaite,  que  d'écrire 
7  m.  2  ou  7  m.  26,  car  la  mention  de  tous  les  chiffres  est  plus 
exacte  que  l'abréviation. 
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SECTION  IV 


Le  dépouillement  et  la  présentation 
des  données  statistiques 


CHAPITRE  PREMIER 
Préparation  du  dépouillement 

I.  —  Généralités  et  division  de  la  matière. 

135.  Le  relevé  des  unités  place  sous  les  yeux  du  statisti- 
cien un  amas  confus  de  matériaux  entre  lesquels  il  opère  un 
choix  par  le  moyen  de  la  critique.  Ce  premier  travail  achevé, 
il  reste  à  classer,  à  distinguer  d'après  leur  nature  et  d'après 
leur  grandeur  les  unités  définitivement  retenues,  puis  à  les 
compter  d'après  les  divisions  établies.  Cet  ensemble  d'opé- 
rations nouvelles  constitue  le  dépouillement.  On  peut  le  dé- 
finir :  «  l'opération  par  le  moyen  de  laquelle  s'opère  la  ré- 
partition des  unités  ou  faits  recueillis  par  le  relevé,  afin 
d'en  rendre  l'étude  possible  et  même  aisée  ». 

On  peut  distinguer  dans  le  dépouillement  trois  opérations 
distinctes  :  1°  reconnaître  les  qualités  individuelles  de 
l'unité,  de  façon  à  permettre  d'éffectuer  la  répartition, 
d'après  leur  nature,  des  faits  observés;  2°  grouper  les  uni- 
tés de  même  genre  dans  les  classes  établies  au  préalable  et 
selon  les  conditions  de  temps  et  d'espace,  pour  constituer 
les  données  statistiques;  3°  totaliser  les  résultats  partiels 
afin  d'arriver  à  une  expression  synthétique.  A  ces  trois  opé- 
rations correspondent  deux  phases  distinctes  du  travail  :  A, 
la  préparation  et  B,  l'exécution  du  dépouillement. 
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Les  faits  statistiques,  convenablement  classés,  forment 
ensemble  ce  qu'on  appelle  une  «  donnée  statistique  ».  La 
donnée  statistique  n'est  pas  la  même  chose  que  l'unité  du 
relevé.  Cette  dernière  est  un  fait  unique  :  un  délit,  une  en- 
treprise industrielle,  une  importation  de  marchandise,  sont 
des  unités  statistiques.  Tant  de  délits  de  telle  sorte,  con- 
statés dans  telle  région  à  une  époque  déterminée,  tant  d'en- 
treprises d'une  nature  spéciale,  existant  dans  une  localité, 
à  une  date  précise,  forment  des  données  statistiques. 
Lorsque  l'unité  est  examinée  par  le  statisticien  au  moment 
de  la  première  opération  du  dépouillement,  on  peut  encore 
reconnaître  ses  qualités  individuelles  :  l'entreprise  indus- 
trielle dont  les  caractères  spéciaux  sont  retracés  par  ce  bul- 
letin, placé  sous  mes  yeux,  occupe  exactement  27  employés 
et  351  ouvriers.  Pour  autant  que  ces  caractères  suffisent  à 
me  renseigner  au  sujet  de  l'importance  de  cette  entreprise, 
je  suis  fixé  à  cet  égard  autant  qu'il  m'est  possible  de  l'être. 
Mais  ces  caractères  individuels  ne  vont  pas  tarder  à  dispa- 
raître :  ayant  à  estimer  l'importance  des  entreprises,  j'ai 
été  amené  à  créer  des  divisions  portant  uniquement  sur  le 
nombre  des  ouvriers  occupés  et  à  établir  ces  divisions  selon 
des  limites  arbitraires,  réalisées  déjà  dans  des  dénombre- 
ments antérieurs  et  admises  par  d'autres  pays.  Il  existe  une 
de  ces  divisions  pour  les  entreprises  occupant  de  200  à  499 
ouvriers;  c'est  là  que  mon  entreprise  de  351  ouvriers  va  se 
trouver  classée  avec  d'autres,  les  unes  plus  importantes,  les 
autres  moins.  L'agglomérat  des  entreprises  faisant  partie 
de  cette  division  pour  l'industrie  étudiée  et  dans  la  localité 
dont  il  s'agit,  forme  une  donnée  statistique.  Il  y  a  autant 
de  données  statistiques  qu'il  y  a  de  nombres,  c'est-à-dire  do 
groupements  de  chiffres,  dans  une  publication.  Ce  qui  ca- 
ractérise la  donnée  statistique,  c'est  la  disparition  de  tous 
les  caractères  individuels  de  l'unité  et  leur  remplacement 
par  des  classes-limites  qui  enserrent,  d'une  manière  plus  ou 
moins  étroite,  une  série  de  faits  présentant  des  caractères 
semblables  ou  à  peu  près  semblables. 
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Le  processus  du  dépouillement  consiste  donc  en  une  série 
de  groupements,  de  totalisations.  Il  y  a  groupement  lors- 
qu'on arrête  les  classes-limites  entre  lesquelles  les  unités 
seront  réparties;  il  y  a  groupement  encore  lorsqu'on  réunit 
les  unités  dans  ces  classes,  comme  on  trie  la  correspondance 
dans  les  bureaux  de  poste  ou  comme  on  place  des  fiches 
dans  un  classeur;  il  y  a  groupement  surtout  lorsqu'on  réu- 
nit des  totaux  partiels  pour  en  faire  un  total  général. 

136.  Le  dépouillement  est  une  phase  extrêmement  impor- 
tante des  travaux  statistiques,  mais  il  n'est  pas,  comme  cer- 
tains paraissent  le  croire,  leur  point  d'aboutissement.  Si  le 
praticien  considère  sa  besogne  achevée  avec  le  dépouille- 
ment, le  statisticien  épris  de  sa  science  considère  qu'alors 
seulement  commence  la  partie  intéressante  de  sa  tâche. 
Après  avoir  groupé  les  résultats  partiels  au  moyen  du  dé- 
pouillement, il  faut  encore  en  effet  les  sérier,  en  tirer  les 
moyennes,  les  soumettre  à  un  contrôle  mathématique,  déter- 
miner leurs  résultats  les  plus  probables,  les  soumettre  à  une 
interprétation  logique.  Il  y  a  des  liens  si  étroits  entre  ces 
diverses  opérations  et  celles  du  dépouillement  qu'on  pour- 
rait presque  considérer  les  unes  comme  la  suite  logique  des 
autres,  mais  il  vaut  mieux  les  étudier  séparément.  Ainsi,  les 
fins  administratives  de  la  statistique  sont  mises  à  part  du 
travail  scientifique.  Toute  cette  dernière  partie  conserve 
alors  son  unité  et  les  phases  dont  elle  se  compose  s'orientent 
vers  un  but  unique  :  la  connaissance  scientifique  des  phé- 
nomènes collectifs.  C'est  pour  ces  raisons  que  nous  avons, 
dans  cet  ouvrage,  séparé  en  deux  parties  l'exposé  théorique 
de  la  méthode  et  qu'après  avoir  montré  les  procédés  maté- 
riels de  recherche,  nous  décrivons,  dans  le  second  livre,  des 
méthodes  scientifiques  de  vérification  et  d'interprétation 
des  résultats. 

137.  Il  n'est  pas  inutile  de  constater  que  toutes  les  parties 
des  renseignements  recueillis  ne  sont  pas  soumises  au  dé- 
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pouillement.  En  effet,  bon  nombre  de  questions  des  bulle- 
tins ne  sont  posées  qu'à  titre  de  contrôle  d'autres  demandes, 
ou  pour  mieux  assurer  l'authenticité  des  déclarations,  ou 
simplement  dans  un  but  administratif  quelconque  n'ayant 
aucune  relation  avec  les  données  statistiques.  Ces  questions 
ont  généralement  leur  utilité  même  au  point  de  vue  statis- 
tique pur,  mais  elles  ne  font  point  partie,  comme  telles,  du 
dépouillement.  Ce  fut  certes  un  grand  progrès  que  la  sub- 
stitution, lors  du  recensement  de  Paris,  en  1817,  des  états 
nominatifs  aux  états  simplement  numériques  qui  étaient  la 
règle  auparavant.  En  donnant  seulement  le  nombre  et  non 
les  noms  des  personnes  comprises  dans  le  recensement,  mai- 
son par  maison,  <(  on  s'expose,  disait  l'auteur  d'un  rapport 
de  l'époque,  à  des  erreurs  considérables,  dont  le  nombre  est 
infini  (1)  ».  Si  utile  que  soit  cette  réforme,  il  n'en  reste  pas 
moins  exact  que  les  noms  des  recensés  ne  fournissent  au- 
cune matière  utilisable  pour  le  dépouillement.  Ces  données 
ne  sont  pas  assimilables  à  des  scories  qu'on  doit  rejeter 
systématiquement,  elles  ont  leur  utilité,  parfois.de  premier 
ordre,  mais  c'est  à  un  autre  moment,  celui  de  la  critique  sta- 
tistique, qu'elles  ont  leur  rôle  à  remplir.  Arrivé  au  stade  du 
dépouillement,  le  statisticien  n'a  plus  à  s'en  occuper. 

II.  —  Conditions  générales  du  dépouillement. 

138.  Nous  avons  fait  remarquer  que  le  dépouillement 
consiste  essentiellement  en  une  suite  de  groupements 
embrassant  un  nombre  croissant  d'objets.  Du  simple 
fait  que  les  unités  ne  peuvent  être  présentées  avec  leurs- 
caractères  individuels,  à  cause  de  l'impossibilité  intel- 
lectuelle de  saisir  les  ressemblances  et  les  différences  des 
objets  compris  dans  une  énumération  infinie,  il  résulte  que 
tout  dépouillement  débute  par  une  totalisation.  Or,  une  con- 
séquence méthodologique  très  importante  se  dégage  de  cette 


(1)  Cfr.  Block  (M.),  Traité  de  statistique,  p.  358,  Paris,  1886. 


PRÉPARATION   DU  DÉPOUILLEMENT 


219 


constatation  :  c'est  que  le  dépouillement  ne  peut  logique- 
ment s'écarter  trop  de  l'état  original  du  matériel.  S'il  sim- 
plifie à  l'excès  les  caractères-  des  unités,  il  nuit  à  la  res- 
semblance, il  altère  les  traits  du  modèle.  Reprenons 
l'exemple  donné  plus  haut  ;  supposons  qu'au  delà  de  200  ou- 
vriers il  n'y  ait  qu'une  classe  unique  groupant  tous  les  éta- 
blissements industriels  comptant  plus  de  200  travailleurs. 
Cette  classe  serait  beaucoup  moins  significative  que  la  sé- 
rie de  celles  établies  d'habitude  dans  les  statistiques  indus- 
trielles, qui  rangent  encore  les  entreprises  en  trois  ou 
quatre  divisions  d'après  l'importance  de  leur  personnel 
ouvrier  (200  à  499  —  500  à  999  —  1.000  à  1,999  —  2.000  et  au 
delà).  Ces  classes  forment  déjà  des  totalisations  où  se 
trouvent  confondues  des  unités  de  caractère  différent, 
quoique  assez  semblable  encore.  Plus  on  les  raréfie,  plus 
on  augmente  l'incertitude  touchant  la  natrire  exacte  et  la 
grandeur  des  unités  qui  s'y  trouvent  renfermées.  En  sim- 
plifiant à  l'excès,  on  empêche  tout  jugement  de  se  former 
sur  une  base  logique,  l'on  rend  presque  inutilisable  le  ma- 
tériel primitif  et  l'on  réduit  la  portée  de  l'utilisation  de  la 
recherche.  Même  avec  des  classes-limites  bien  établies-,  il 
peut  être  utile  de  faire  ressortir,  à  l'aide  de  notes,  les  carac- 
téristiques de  certaines  unités  comprises  dans  ces  classes, 
mais  qui  présentent  des  traits  se*  détachant  de  l'ensemble. 

En  plus  des  considérations  ci-dessus,  il  convient  de  re- 
marquer que  le  matériel  original  n'est  pas  à  la  disposition 
des  chercheurs,  de  telle  sorte  que  la  publication,  pour  pro- 
duire son  maximum  d'utilité,  doit  s'écarter  aussi  peu  que 
possible  de  la  situation  qu'ont  fait  connaître  les  bulletins. 
Comme  nous  ne  pouvons  prévoir  jusqu'à  quel  point  de  dé- 
tail l'un  ou  l'autre  chercheur  voudra  descendre,  il  est  bon 
de  se  montrer  très  prudent  au  cours  de  l'élaboration  des 
modèles  de  tableaux,  en  ce  qui  concerne  les  éliminations  à 
pratiquer  dans  le  matériel  original.  Dans  une  statistique 
des  salaires,  la  première  exigence  scientifique  consiste  à 
recueillir  des  salaires  qui  représentent  effectivement  ce 
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que  gagne  chaque  ouvrier  pendant  une  journée  normale  de 
travail  et  à  rejeter  les  moyennes,  qu'elles,  se  rapportent  à 
un  seul  individu  ou  à  plusieurs.  Mais,  même  avec  ce  prin- 
cipe dont  l'exactitude  est  évidente,  on  peut  arriver  à  un 
rendement  scientifique  très  différent  selon  le  mode  d'orga- 
nisation du  dépouillement  et  de  la  présentation.  En  négli- 
geant certains  détails  on  peut  nuire  gravement  à  l'utilisa- 
tion ultérieure  des  données  statistiques.  Ceci  revient,  en 
somme,  à  augmenter  le  coût  relatif  de  la  statistique  :  moins 
les  renseignements  donnés  sont  nombreux,  plus  s'élève  leur 
coût  relatif.  Pour  répondre  à  un  nombre  de  problèmes  con- 
venables, une  statistique  des  salaires  doit  envisager  :  la  na- 
ture exacte  de  l'industrie,  le  mode  d'exploitation  des  entre- 
prises, l'importance  de  la  localité  où  l'entreprise  est 
établie,  sa  situation  urbaine  ou  rurale,  l'âge  et  le  sexe  des 
ouvriers,  leur  spécialité  professionnelle,  la  nature  du  tra- 
vail :  mécanique  ou  à  la  main,  etc.  (1).  Si  l'un  de  ces  élé- 
ments fait  défaut,  telle  recherche  intéressante  peut  être 
rendue  impossible. 

Cette  exigence  se  trouve  limitée  par  la  dépense  en  temps 
et  en  argent  que  rendrait  nécessaire  une  publication  aussi 
étendue.  Mais  cette  dernière  considération  n'enlève  rien 
de  sa  force  au  principe  précédent.  La  statistique  doit  à  la 
recherche  scientifique  de 'présenter  les  résultats  de  ses  in- 
vestigations dans  le  plus  grand  détail  possible.  De  même 
que,  dans  les  sciences  naturelles,  l'observation  in  situ  et 
la  présentation  dans  les  conditions  de  l'observation  sont 
à  la  base  de  la  méthode  (2) ,  ainsi,  dans  notre  matière,  doit- 
on  conserver  avec  soin  les  caractères  propres  des  unités 
recueillies. 


(1)  La  statistique  des  salaires  dans  les  industries  textiles  en  Belgique  au 
mois  d'octobre  190],  (Office  du  Travail,  Bruxelles.  1003),  ne  comprend  pas 
moins  de  100  tableaux  analytiques  au  moyen  desquels  ces  divers  éléments  et 
leurs  combinaisons  se  trouvent  présentés  et  étudiés. 

(2)  Voyez  sur  ce  point  les  remarques  si  judicieuses  de' M.  Oilson  dans  son 
beau-  livre  :  Le  Musée  d'histoire  naturelle  moderne,  p.,  35,  Bruxelles,,  1914. 
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Ce  qui  importo  surtout,  c'est  que  les  données  publiées 
répondent  à  un  usag'e  pratique,  qu'elles  renferment  la  so- 
lution à  donner  au  plus  grand  nombre  possible  de  ques- 
tions, sans  négliger,  à  côté  du  but  scientifique,  l'intérêt,  ad- 
ministratif. Le  statisticien  est  parfois  tenté  de  considérer 
avec  quelque  dédain  l'un  ou  l'autre  point  dont  l'intérêt 
lui  échappe.  Si  la  demande  est  formulée  en  vue  de 
répondre  à  un  but  déterminé  et  n'est  pas-  inspirée  par. une 
vaine  curiosité,  pourquoi  ne  pas  tenter  de  lui  donner  ré- 
ponse ?  Pour  un  groupe  d'administrateurs  telle  question, 
qu'on  est  tenté  de  rejeter,  peut  avoir  autant  d'intérêt  qu'en 
présente  pour  le  statisticien  la  détermination  d'un  coef- 
ficient. Ce  qui  n'est  pas  dépouillé  et  publié  est  pratique- 
ment perdu  (  1  ) . 

139.  La  multiplicité  des  sujets  auxquels  touche  la 
statistique  et  l'obligation  de  présenter  les  questions 
sous  leurs  différents  aspects  afin  de  permettre  l'utili- 
sation aussi  complète  que  possible  du  matériel  recueilli, 
nous  avertissent  suffisamment  de  ce  que  le  dépouil- 
lement comportera  souvent  plusieurs  phases  successives; 
chacune  d'elles  sera  relative  à  un  groupe  distinct  de 
questions.  L'ensemble  des  rubriques  de  présentation  des 
données  relatives  à  un  groupe  spécial  de  questions  s'ap- 
pelle un  cadre  statistique.  Dans  un  recensement  de  la  po- 
pulation, le  dénombrement,  par  commune,  de  la  population 
de  droit  et  de  fait,  du  territoire  et  des  maisons  et  bâtiments 
forme  un  cadre  statistique  ;  il  y  a  un  lien  entre  la  popula- 
tion de  droit  et  de  fait,  comme  il  y  en  a  un  entre  la  popu- 
lation et  le  territoire  (densité  de  la  population)  et  entre  le 
nombre  de  ménages  et  le  nombre  de  maisons  habitées.  En 
ouvrant  au  hasard  le  recensement  de  la  population  en  Bel- 
gique (1910)  nous  voyons  que,  dans  l'arrondissement  de 
Courtrai,  il  y  a  44,597  maisons  et  45,153  ménages,  d'où  l'on 


(1)  Bowley  (Eléments  of  statistics)  expose  sur  ce  point  des  aperçus  très 
intéressants. 
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peut  conclure  à  l'instant  que,  sauf  exception,  chaque  mé- 
nage a  sa  maison.  A  Bruxelles,  au  contraire,  il  y  a  58,299 
ménages  et  seulement  20.758  maisons.  La  réunion,  dans  un 
même  cadre,  de  données  se  rapportant  à  un  même  groupe  de 
questions,  facilite  les  recherches  et  suggère  souvent  des 
rapprochements  utiles.  Un  autre  cadre  statistique  sera 
formé  en  tenant  compte  de  l'âge  des  habitants  et  de  leur 
degré  d'instruction,  etc. 

Pour  qu'un  cadre  statistique  soit  bien  composé,  il  doit 
répondre  aux  conditions  suivantes  :  1"  constituer  un  en- 
semble logique  ayant  trait  à  un  groupe  de  questions; 
2e  présenter  les  données  dans  un  ordre  rigoureux  en 
rapprochant  celles  qui  sont  connexes;  3°  ne  contenir 
que  des  données  homogènes,  présentées  d'après  une 
base  unique;  c'est  par  une  fausse  économie  ou  par 
le  vain  désir  de  paraître  savant  en  se  montrant  com- 
pliqué qu'on  accumule  les  données  dans  un  cadre  unique; 
4°  comporter  une  présentation  telle  que  les  données  se  com- 
binent entre  elles  et  paraissent  sous  leurs  différents 
aspects  ;  la  simple  juxtaposition  des  données  statistiques  ne 
suffit  pas  à  réaliser  les  fins  propres  de  la  présentation. 

140.  On  peut  considérer  comme  un  cadre  statistique  un 
exposé  systématique  réduit  à  un  seul  élément,  mais,  en 
général,  on  réserve  cette  dénomination  à  des  ensembles  de 
données  se  groupant  autour  d'un  même  sujet.  Comme 
exemple  du  premier  cas,  il  est  certain  que  les  données  sui- 
vantes forment  un  cadre  statistique  simple  : 


ANNÉES 

Population  de  la  France  (ré- 
si  lente)  évaluée  au  milieu 
tle  chaque  année  (1). 

ANNÉES 

Population  de  la  France  (ré- 
sidente) évaluée  au  milieu 
de  chaque  année  (1). 

1906 

39,282,000 

1909 

39,421,000 

1907 

39,279,000 

1910 

39,528,000 

1908 

39,368,000 

1911  (prov.) 

39,600,000 

(1)  Statistique  générale  de  la  France.  Annuaire  statistique  1911.  Résumé 
rétrospectif,  n°  11. 
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Mais  ce  n'est  pas  sous  cette  forme  simple  que  se  présen- 
tent d'habitude  les  cadres  statistiques.  Ils  visent  à  grouper, 
dans  les  diverses  colonnes  d'un  tableau,  des  éléments  qui, 
rapprochés  les  uns  des  autres,  fournissent  aux  chercheurs 
la  réponse  à  diverses  questions.  Ainsi  on  rapproche  l'état  et 
le  mouvement  de  la  population  comme  dans  le  cadre  sui- 
vant, emprunté  à  la  source  citée  plus  haut  : 
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308 
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36 
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337 

703 

86 

+  71 

1  56  1  96 

1.78 

Nous  examinerons  plus  loin  le  mécanisme  spécial  de  la 
formation  des  cadres  statistiques,  qui  peuvent  revêtir  une 
complexité  croissante,  mais  auparavant  il  convient  de  dire 
quelques  mots  de  l'aspect  le  plus  général  que  présente  cette 
question. 


141.  D'après  Stanley  devons  (1),  le  professeur  de  Mor- 
gan (2)  aurait  été  le  premier  logicien  qui  se  soit  aperçu  qu'il 
peut  exister  des  syllogismes  dans  lesquels  les  nombres  des 
objets  formant  les  différents  termes  du  syllogisme  peuvent 


(1)  Stanley  (Jevons)  :  «  On  a  gênerai  System  of  numerically  definite  rea^on- 
ings  »  dans  :  Pure  logic  and  other  minor  works,  London  1890,  pp.  173  et  suiv. 

(2)  Cfr.  A.  de  Morgan:  Forma]  logic  :  or,  the  calculus  of  Inference.  London,. 
Taylor  and  VValton,  1847. 
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être  exactement  définis.  Avant  de  Morgan,  les  logiciens  se 
bornaient  à  introduire  des  notions  quantitatives  vagues, 
comme  :  peu,  beaucoup  plus,  moins,  etc.  Peu  de  temps  après 
de  Morgan,  le  professeur  Boole  (1)  s'est  occupé  de  la  même 
question  sous  le  titre  :  «  On  statistical  conditions  ».  La 
notation  employée  par  de  Morgan  comme  par  Boole  prêtait 
à  des  critiques  fondées;  elle  a  été  corrigée  et  simplifiée  par 
Stanley  Jevons.  Cette  dernière  notation  a  été  adoptée,  avec 
quelques  modifications  de  détail,  par  M.  U.  Yule.  Dans 
l'exemple  que  nous  dormons  ci-après,  nous  suivons  nous- 
même  la  notation  de  M.  Yule  (2). 

Comme  le  dit  cet  auteur,  il  est  parfois  nécessaire,  dans 
un  but  théorique,  de  posséder  une  notation  simple  pour 
désigner  les  classes  formées  parmi  les  attributs  d'un 
groupe  social  et  pour  symboliser  les  nombres  d'observa- 
tions relatives  à  chaque  attribut.  Le  but  d'une  telle  re- 
cherche, écrit  Stanley  Jevons,  est  de  déterminer,  d'une 
manière  aussi  exacte  que  possible,  le  nombre  d'objets  indi- 
viduels composant  des  classes  ou  groupes  d'objets,  étant 
donnée  une  condition  logique  quelconque. 

Avant  d'exposer  un  exemple,  il  est  nécessaire  de  préciser 
la  notation  employée.  On  désignera  par  A,  B,  C,  les  divers 
attributs  observés.  Tous  les  individus  possédant  l'attribut 
A,  forment  ensemble  la  classe  A.  L'attribut  A  est  positif; 
on  doit  pouvoir  désigner  l'absence  de  cet  élément;  pour 
cela  on  employera  les  lettres  de  l'alphabet  grec  :  a  p  y. 
Donc  a  signifiera  la  classe  de  ceux  qui  ne  possèdent  pas  A  ; 
B  a,  la  classe  de  ceux  qui  possèdent  B,  mais  qui  se  font 
remarquer  par  l'absence  de  A,  et  ainsi  de  suite.  Ces  com- 
binaisons de  lettres  s'appellent  des  ((  classes  symboles  ».  Si 
l'on  veut  exprimer  le  nombre  d'observations  que  comprend 


(1)  Cfr.  Boole  :  Laws  of  Thought,  1854  (ch.  XIX,  «  On  statistical  con- 
ditions »). 

(2)  Yule  (G.  U.),  An  introduction  to  the  theory  of  statistics,  ch.  I, 
London  1911. 
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chaque  classe,  on  choisira  la  lettre  relative  à  cette  classe  et 
on  la  mettra  entre  parenthèses  (A),  (a),  (B),  (  ),  etc. 

Soient  les  notations  suivantes  : 

A  =  ouvriers  recevant  un  salaire  en  argent; 
B  =  ouvriers  recevant  un  salaire  en  argent  et  la  nourriture; 
C  =  ouvriers  recevant  un  salaire  en  argent,  la  nourriture  et  le 
logement. 

Nous  pouvons,  à  l'aide  de  cette  notation,  en  introduisant 
les  symboles  négatifs,  réaliser  les  combinaisons  suivantes  : 

(A)  =■  nombre  d'individus  possédant  le  caractère  ou  l'attribut  A; 
(a)  =  nombre  d'individus  ne  possédant  pas  le  caractère  ou  l'at- 
tribut A; 

(A  B)  =  nombre  d'individus  possédant  à  la  fois  le  caractère  ou 
l'attribut  A  +  B; 

(a  B)  =  nombre  d'individus  possédant  seulement  le  caractère  ou 

l'attribut  B,  mais  non  A. 
(ABC)  =  nombre  d'individus  possédant  à  la  fois  le  caractère  ou 

l'attribut  A  -f-  B  +  C; 
(ctBC)  =  nombre  d'individus  possédant  à  la  fois  le  caractère  ou 

l'attribut  B  +  C,  mais  non  A; 
(a  p  C)  =  nombre  d'individus  possédant  le  caractère  ou  l'attribut 

C,  mais  ni  A  ni  B. 

Les  classes  positives  et  négatives  forment  les  classes 
contraires,  l'une  par  rapport  à  l'autre,  et  leurs  fréquences 
sont  des  fréquences  opposées.  Les  classes  se  distinguent 
par  ordre  ;  le  rang  de  leur  ordre  est  celui  du  nombre  d'attri- 
buts de  la  classe. 

(A)  =  1er  ordre.  —  (A  B)  =  2e  ordre.  —  (A  B  C)  =  3e  ordre. 

Les  classes  du  n"  ordre,  dans  le  cas  de  n  attributs,  sont 
dénommées  classes  les  plus  élevées  et  leurs  fréquences  sont 
les  «  fréquences  dernières  »  (ultimate  f requencies) .  Lors- 
qu'on connaît  les  «  fréquences  dernières  »,  toutes  les  autres 
peuvent  être  obtenues  par  simple  addition. 


15 


226 


PRINCIPES  DE  STATISTIQUE 


142.  Exemple  :  nombre  des  ouvriers  boulangers-pâtis- 
siers de  plus  16  ans  d'après  la  nature  du  salaire  qu'ils 
reçoivent  (Recens.  gén.  des  Ind.  et  des  Métiers  en  Belgique, 
octobre  1896,  vol.  XI,  p.  317). 

Nombre  des  ouvriers  :  445. 

A  =  ouvriers  recevant  seulement  un  salaire  en  argent .  122  \ 

B  =  ouvriers  recevant,  outre  leur  salaire,  la  nourriture.  64  / 

C  =  ouvriers  recevant,  outre  leur  salaire,  la  nourri-  >  445 

ture  et  le  logement   243  \ 

D  =  ouvriers  ne  recevant  aucun  salaire  .......  16  / 


Cela  étant  donné,  cherchons 
troisième  ordre;  nous  avons  : 

(ABC)  =  429  (122  +  64  +  243) 
(ABï)  =  186  (122+  64) 
(APC)  =  365  (122+  243) 
(APt)  =  122  (122) 


les  fréquences  dernières  du 


(aBC)  =  307  (64  +  243) 
(oBt)  =  64  (64) 
(opC)  =  243  (243) 
(apT)  =  16  (16) 


Si  l'on  cherche  la  fréquence  de  premier  ordre  d'un  attri- 
but, il  n'y  a  qu'à  réunir  les  fréquences  des  classes  dans 
lesquelles  figure  cet  attribut.  Soit  à  rechercher  la  fréquence 
de  (A)  : 

(ABC)  +  ABT  +  (ApC)  +  (ApT)  =  (A)  =  1102  (429  + 186  +  365  + 122). 

De  même  pour  AB,  ABC,  AC. 
(ABC)  +  (ABt)  =  (AB)  =  615  (429  + 186)  ; 
(ABC)  =  (ABC)  =  429  (122 +  64  +243); 

(ABC)  —  (ApC)  =  (AC)  =  794  (429  +  365). 


D'après  ce  qui  précède,  le  nombre  total  des  observations 
est  : 


N  = 


1732  (429  +  186  +  365  +  122  +  307  +  64  +  243  +  16). 
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On  a  donc,  en  ne  considérant  que  les  classes  positives 


N  =  1732. 

(A)  =  1102. 

(B)  =  986. 

(C)  =  1344. 


(AB)  =  615. 

(AC)  =  794. 
(BC)  =  736. 

(ABC)  =  429'. 


Analysons  la  classe  de  dernière  fréquence  (A). 

Elle  se  compose  du  nombre  des  attributs  relevés  dans 
chaque  groupe  de  dernière  fréquence  où  se  remarque  la 
présence  de  la  classe  (A)  (ouvriers  recevant  un  salaire  en 
argent).  En  voici  le  détail  : 


(ABC) 


(ABy) 


(ABCj 


(APt) 


Ouvriers  payés  en  argent  .  . 
Ouvriers  payés  en  argent  plus  la 

nourriture  

Ouvriers  payés  en  argent,  plus  la 

nourriture  et  plus  le  logement. 

Ouvriers  payés  en  argent  .  .  . 
Ouvriers  payés  en  argent  plus  la 

nourriture  

(Non  compris  ceux  qui  reçoivent 

de  plus  le  logement)  .... 

Ouvriers  payés  en  argent  .  . 
Ouvriers  payés  en  argent  plus  la 

nourriture,  plus  le  logement  . 
(Non  compris  ceux  qui  reçoivent 

la  nourriture  et  un  salaire)  .  . 

Ouvriers  payés  en  argent  .    .  . 

(Non  compris  ceux  qui  reçoivent 
la  nourriture  et  un  salaire)  .  . 

(Non  compris  ceux  qui  reçoivent 
un  salaire,  la  nourriture  et  le 
logement)  


(ABC)  =  429 
[122  -j-64  +  243) 

(ABy)  =  186 
(122  +  64) 

(APC)  =  363 
(122  +  243) 


(APt)  = 

(122) 


(A) 
(1102) 


143.  Stanley  Jevons  fait  remarquer  (1)  que  le  processus 
de  développement  ci-dessus  est  la  principale  particularité 


(1)  Cfr.  Stanley  (Jevons)  :  On  a  gênerai  system,  etc.  (loc.  cit.),  pp.  179-180. 
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du  système  de  logique  du  professeur  Boole  et  qu'il  dépend 
d'une  loi  fondamentale  de  l'intelligence  que  Jevons  appelle 
loi  de  dualité. 

Soient  les  termes  A  et  B  ;  il  est  nécessairement  vrai, 
d'après  cette  loi,  que  : 

A  est  B  ou  n'est  pas  B. 

Ce  qui  s'exprime,  dans  la  notation  proposée  par  Jevons, 
par  la  formule  : 

A  =  A  B  •/'  A  p. 

En  faisant  entrer  un  terme  nouveau,  0,  il  est  sûr  que  : 
A  =  A  C  V  At- 

En  combinant  les  deux  développements,  on  arrive  à  la 
formule  : 

(A)  =  (A  B  G)  ■/■  (ABT)  -M^C)  V  (AP  t). 

La  classe  de  dernière  fréquence  (A),  exprimée  numéri- 
quement, signifie  donc  que,  quels  que  soient  les  arrange- 
ments auxquels  on  s'arrête  successivement  entre  les  dif- 
férents attributs  exprimés  par  A,  B,  C,  on  n'arrivera 
jamais  à  un  résultat  final  dans  lequel  les  caractères  addi- 
tionnés des  A  seront  supérieurs  à  1102.  Ce  chiffre  est  une 
expression  intégrale  pour  la  classe  de  fréquence  (A). 

La  notation  négative  exprimée  par  les  caractères  de 
l'alphabet  grec  est  très  commode  pour  marquer  d'une  façon 
simple  une  notion  assez  complexe.  De  plus,  elle  permet  de 
résoudre  facilement  des  formules  qui,  par  voie  de  substitu- 
tion, reconstituent  les  classes  de  fréquence  positive. 

Ainsi  : 

(ABT)  =  (AB)  —  (ABC)  =  615  —  429  =  186. 

(ApT)  =  (A)  —  (ACj  —  (ABt)  =  1102  —  794  —  186  =  122. 

(ctpï)  =  N  —  (B)  —  (C)  -)-  (BG)  —  (ApT)  =  1732  —  986  —  1344  + 

736  —  122  =  2468  —  2452  =  16. 
(ApG)  =  (AC)  —  (ABC)  =  794  —  429  -  365. 
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144.  Les  formules  données  plus  haut  ne  sont  pas  seu- 
lement utiles  pour  déterminer  le  nombre  de  classes  pos- 
sible qui  existe  dans  des  conditions  logiques  déterminées, 
elles  peuvent  aussi  contribuer  à  faciliter  le  calcul  des  pro- 
babilités comme  le  montre  Stanley  Jevons  par  l'exemple 
suivant  : 

Soient  p  la  probabilité  de  l'arrivée  de  A  et  g  celle  de 
l'arrivée  de  B;  pq  est  la  probabilité  de  l'arrivée  simultanée 
de  AB;  la  probabilité  que  A  n'arrivera  pas  (ou  celle  de 
l'arrivée  de  a)  est  : 

pour  a,  1  —  p;  pour  p,  1  —  q. 


Donc,  on  a  : 

Probabilité  de  AB  —  pq; 

Id.  de  Ap  ==p  (1  —  q); 
Id.  deaB  =  (l—  p)q; 
Id.       de  ap  =  (1  —  p)  (1  —  q). 


C'est  encore  par  une  application  des  règles  logiques  qui 
précèdent  qu'on  arrive  à  déterminer  le  nombre  de  combi- 
naisons auxquelles  peuvent  donner  lieu  un  nombre  d'élé- 
ments donnés  réunis  dans  un  cadre  statistique. 

Le  nombre  d'attributs  à  combiner  est  par  exemple  6. 

On  veut  combiner  ces  attributs  deux  à  deux;  on  a  une 
classe  de  l'ordre  2. 

r>    j       r>    Il  (W          tï        6.5        30         ...  ,.      .  ... 

Ordre  2.  — -.  —  ■=-  ^  =  —  =  15  combinaisons  possibles. 


On  désire  combiner  ces  attributs  trois  à  trois.  On  a  donc  : 


»,    „  n  (n  —  1  m  —  2      6.5.4  120 

Ordre  3.  -.  — -  =  -.  -r — K  =  —r-  =  20  combinaisons 

1.2.3  1.2.3  6 

possibles. 
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Si  l'on  voulait  arriver  à  une  combinaison  quatre  par 
quatre,  on  aurait  : 

„,    ,  ,n(n  -  lj(n—  %{n  —  3)     6.5.4.3     360  ,„ 

Ordre  4.  — - — , — '--  ^A-.  -  =  -; — ^ — r; — T  =  -ry-  =  15  com- 

1.2.3.4  1.2.3.4  24 

binaisons  possibles. 

145.  Les  exemples  de  tableaux  statistiques  d'une  com- 
plexité croissante  sont  fort  faciles  à  trouver.  Ces  tableaux, 
non  seulement  présentent  ensemble  plusieurs  données, 
mais,  de  plus,  les  combinent  en  fonction  les  unes  des  autres, 
comme  les  tableaux  qui  groupent  les  causes  de  décès  en 
relation  avec  l'âge,  l'état  civil,  la  profession,  ou  les  statis- 
tiques de  décès  qui  cherchent  les  variations  du  taux  de 
mortalité  en  relation  avec  la  période  de  l'année,  la  tem- 
pérature, la  pression  barométrique,  etc.  Malgré  les  exem- 
ples fort  nombreux  qui  existent,  et  simplement  pour  éviter 
au  lecteur  la  fatigue  de  les  rechercher,  nous  reproduisons 
ci-après  quelques  types  de  tableaux  en  les  rangeant  selon 
l'ordre  de  leur  complexité  croissante. 


I.  —  ANGLETERRE. 

Nombre  des  ouvriers  occupés  dans  les  industries  textiles 
(tontes  industries  réunies). 


ANNÉES 

Nombre  d'ouvriers  occupés 

ANNÉES 

Nombre  d'ouvriers  occupés 

1896 

1,077,687 

1901 

1,029,353 

1897 

1,051,564 

1904 

1,026,378 

1898 

1,036,570 

1907 

1,087,223 

Le  nombre  des  ouvriers  dans  les-  industries  textiles  est 
une  donnée  d'un  caractère  général  qu'on  désire  aussitôt 
développer  en  indiquant  en  regard  le  nombre  d'ouvriers  et 
d'ouvrières  : 


PRÉPARATION  DU  DÉPOUILLEMENT 


231 


IL  —  ANGLETERRE. 

Nombre  des  ouvriers  occupés  dans  les  industries  textiles 
(toutes  industries  réunies). 


ANNÉES 


NOMBRE  DES  OUVKIEKS  OCCUPÉS 


Hommes 


Femmes 


Total 


1896 
1897 
1898 
1901 
1904 
1907 


412,841 
396,851 
387,583 
379,211 
382,835 
407,360 


664,846 
654,713 
648,987 
650,142 
643,543 
679,863 


1,077,687 
1,051,564 
1,036,570 
1,029,353 
1,026,378 
1,087,223 


Parmi  ces  ouvriers,  on  peut  établir  des  divisions  d'âges 
conformes  aux  prescriptions  des  lois  sur  la  réglementation 
du  travail.  (Voir  tableau  III,  page  suivante) 
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Au  lieu  de  considérer  toutes  les  industries  réunies,  la 
statistique  peut  aussi  relever  séparément  lés  données  qui 
concernent  chaque  branche  d'industrie  en  particulier  et 
présenter  à  part  les  chiffres  relatifs  à  l'industrie  du  coton, 
de  la  laine  (cardée  et  peignée),  du  jute,  du  lin  et  du  chanvre, 
de  la  soie,  de  la  bonneterie,  de  la  dentelle,  des  tissus  élas- 
tiques, crin,  etc. 

Le  tableau  définitif  prend  alors  la  forme  ci-après.  (Voir 
tableau  IV,  page  suivante.) 


(1)  D'après  Stàtistical  Abstraci  for  the  United  Kingdom,  Loin  Ion,  1913, 
no  81,  pp.  352-53. 
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Une  cinquième  forme  de  présentation  peut  être  introduite 
en  distinguant  les  comtés  ou  les  localités.  Elle  est  très 
usuelle  car  la  présentation  sur  la  base  géographique  est 
des  plus  féconde  en  aperçus. 

146.  Etant  donnés  ces  éléments,  le  statisticien  a  le  choix 

entre  différentes  combinaisons  pour  présenter  les  résultats 

de  la  statistique.  A  son  dernier  stade,  le  relevé  ci-dessus  se 

compose  de  quatre  éléments  :  la  date  du  relevé,  la  nature  de 

l'industrie,  l'âge  des  ouvriers  et  leur  sexe.  Si  ces  éléments 

sont  associés  deux  à  deux,  on  aura  : 

n(n—  1)     4.3      12     a  ... 

—j  2~  =  ï  2  =  ~2  combinaisons. 

S'ils  sont  associés  trois  à  trois,  on  aura  : 

n(n— A)(n  —  2)     4.3.2     24      ,       ,  .  . 
 î — 2 — 3  =1  « — 3  =  ~6  =  combinaisons- 

Dans  le  Census  anglais,  par  exemple,  on  trouve  12  attri- 
buts différents,  ce  qui  fait,  dit  M.  Bowley  (1),  qu'en  les 
combinant  ensemble,  on  a  le  choix  entre  66  façons  de  tabuler 
différentes  quand  on  prend  2  éléments  ensemble,  220  quand 
on  en  prend  3,  495  quand  on  en  prend  4.  En  effet  : 
n(n  —  1)      12  .  11  132 


1.2         1.2  2 

n  (n  —  1)(n  —  2)  _  12  .  I  l  .  10  _  1320 
1.2.3      ~    1  .  2  .  3    "  6 

n(n  —  l)(n  —  2)  (n  —  3)     12  .  11  .  10  .  9  11880 


=  66 

220 

=  49o 


1.2.3.4  1.2.3.4  24 

Ainsi,  représentant  la  nature  de  l'industrie  pari,  l'âge 
des  ouvriers  par  A,  leur  sexe  par  S,  la  date  du  relevé  par  D, 
les  résultats  du  tableau  (IV)  peuvent  être  présentés  comme 
ceci  : 


Si 

s. 


 Ai_ 

D,  D2 


(1)  Bowi.ey  (A.),  Eléments  of  statistict,  London,  1902,  p.  78. 
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ou  encore  de  cette  manière  : 

 h  

I»;  Dj,  D3  D4 


On  peut  encore  procéder  d'une  autre  façon  : 


Il  est  aussi  possible  de  rapprocher  les  S  en  envisageant 
séparément  les  I  : 


Etc.. 


Entre  ces  combinaisons  et  toutes  les  autres  possibles,  on 
choisira  évidemment  celle  qui  paraîtra  le  mieux  à  même  de 
répondre  de  la  façon  la  plus  adéquate  à  la  question  qu'on 
veut  élucider.  La  forme  générale  la  plus  simple  est  celle 
qui  consiste  à  énumérer  dans  la  colonne  de  gauche  les  in- 
dustries et  les  dates  du  relevé,  comme  dans  le  tableau  IV 
ci-dessus.  L'indication  de  la  localité  prend  souvent  la  place 
des  dates,  car  il  est  rare  qu'on  compare  des  situations  à 
des  dates  différentes  dans  la  même  localité. 
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III.  —  Des  classifications  statistiques. 

147.  Les  classifications  sont,  en  statistique,  d'une  impor- 
tance exceptionnelle,  parce  que  d'elles  dépend,  en  bonne 
partie,  le  degré  <le  pénétration  et  d'utilisation  des  résultats 
du  relevé.  Il  ne  servirait  de  rien  d 'avoir,  au  cours  du  relevé, 
respecté  les  règles  fondamentales  de  l'observation  selon  le 
temps  et  l'espace,  si  ces  distinctions  essentielles  ne  se 
retrouvaient  pas  dans  les  classifications  suivant  lesquelles 
les  unités  sont  ordonnées.  Il  existe  donc  un  lien  intime  entre 
les  règles  qui  président  au  classement  et  celles  qui  con- 
cernent le  relevé  :  c'est  un  point  qui  a  semblé  échapper  à 
l'attention  de  plusieurs  statisticiens  et  qu'il  importe  cepen- 
dant de  poser  dès  le  début. 

Classer,  c'est  répartir  les  unités  du  phénomène  en 
groupes  ou  sous-groupes  d'après  leurs  caractères,  et  c'est, 
d'autre  part,  observer  les  différences  qu'elles  présentent 
quand  elles  sont  groupées  selon  un  caractère  donné. 

Soit  une  statistique  des  décès  classés  d'après  leurs 
causes  :  on  a  d'abord  à  établir  une  classification  des  causes 
de  décès,  comme  celle  basée  sur  le  siège  des  maladies, 
par  exemple.  Ensuite,  en  examinant  le  nombre  de  décès 
causés  par  chaque  maladie,  on  devra  répartir  ce  nombre 
selon  certaines  divisions,  telles  que  l'âge  et  l'état  civil  des 
décédés. 

Il  suit  de  là  que  les  classements  en  statistique  sont  de 
deux  espèces  :  1°  ceux  qui  visent  les  différents  caractères 
que  le  phénomène  peut  revêtir  quand  on  le  considère  sous 
un  aspect  spécial;  2°  ceux  qui  partagent  en  catégories 
diverses  les  unités  observées  sous  un  point  de  vue  parti- 
culier et  faisant  partie  d'un  ensemble  :  c'est  la  distribution 
par  fréquence. 

Nous  exposerons  successivement  les  règles  générales 
applicables  aux  classifications  comme  à  la  distribution  par 
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fréquence  ;  ensuite,  nous  verrons  quelles  sont  les  applica- 
tions logiques  qui  découlent  de  l'étude  des  tableaux  à  double 
entrée  dans  lesquels  se  combinent  les  deux  principes  de 
classement  indiqués  ci-dessus,  tableaux  auxquels  le  profes- 
seur Pearson  a  donné  le  nom  de  tableaux  de  contingence 
(contingency-tables) . 

148.  Les  classifications  proprement  dites  doivent  ré- 
pondre à  une  idée  générale,  la  plus  simple  et  la  plus  étendue 
qu'il  se  peut,  de  façon  à  comprendre  toutes  les  manifes- 
tations du  phénomène  étudié.  Cette  idée  générale  est  sus- 
ceptible de  revêtir  un  grand  nombre  de  formes  ;  il  est  rare 
qu'un  relevé  statistique  ne  comporte  qu'une  seule  classifi- 
cation: d'ordinaire,  il  en  faut  deux  ou  trois  pour  mettre  en 
évidence  les  divers  aspects  sous  lesquels  le  phénomène 
demande  à  être  étudié.  Les  statistiques  démographiques 
utilisent  des  classifications  basées  sur  des  critères  appro- 
priés aux  faits  qu'elles  considèrent  :  la  répartition  géogra- 
phique, à  l'aide  de  laquelle  peut  se  déterminer  l'influence 
du  milieu;  les  répartitions  basées  sur  l'âge  des  recensés 
dans  les  dénombrements  de  la  population,  sur  l'âge  des 
époux  au  moment  du  mariage  ou  du  divorce,  sur  l'âge  des 
habitants  classés  d'après  leur  degré  d'instruction;  le  par- 
tage des  décès  s'opère  naturellement  d'après  l'âge,  comme 
aussi  selon  les  maladies  ou  l 'état  civil  ou  la  profession  des 
décédés;  dans  les  statistiques  économiques  on  adoptera 
comme  base  des  classifications  usuelles  l'industrie  ou  le 
métier;  dans  les  statistiques  commerciales,  la  nature  des- 
produits échangés,  les  provenances  et  les  destinations  des 
échanges  commerciaux.  Ainsi,  chaque  espèce  de  statistique 
a  ses  principes  de  classification  particuliers  dont  elle  ne 
s 'éloigne  guère.  Il  faut  et  il  suffit  que  ce  principe  soit  assez 
large  pour  couvrir  toutes  les  manifestations  du  phénomène, 
de  même  que  le  relevé  doit  s'étendre  à  toutes  ces  manifes- 
tations, en  quelque  lieu  qu'elles  se  produisent.  Le  principe 
de  classification  doit  être  approprié  au  but  particulier  de 
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chaque  statistique;  c'est  le  talent  du  statisticien  de  recon- 
naître entre  des  principes  différents  et  également  bons  au 
premier  aspect,  celui  qui  pourra  le  mieux  faire  ressortir  les 
caractères  essentiels  du  phénomène,  en  même  temps  qu'il 
s'adaptera  le  mieux  aux  limites  de  fréquence  établies 
d'autre  part. 

149.  Dans  les  classifications  statistiques,  deux  difficultés 
opposées  sont  à  vaincre.  Les  nomenclatures  trop  brèves 
embrassent  dans  une  même  classe  ou  rubrique  des  choses 
extrêmement  différentes,  n'ayant  souvent  entre  elles 
d'autres  rapports  que  la  désignation  générale  sous  laquelle 
il  est  convenu  de  les  réunir.  Ainsi,  la  statistique  commer- 
ciale de  la  Hollande,  qui  ne  comprend  qu'un  nombre  assez 
limité  de  rubriques,  se  termine  par  une  classe  comprenant 
toutes  les  marchandises  autres  que  celles  énumérées  précé- 
demment; clans  une  classe  de  la  statistique  commerciale 
belge  (merceries-quincailleries)  ne  sont  pas  réunies  moins 
de  cent  quarante-six  espèces  de  marchandises  de&  plus  dis- 
parates. Il  convient  d'éviter  dans  les  classifications  les 
rubriques  intitulées  :  «  divers  ».  L'obligation  où  l'on  se 
trouve  d'y  recourir  prouve  ou  que  l'énumération  est  incom- 
plète, ou  que  le  principe  de  la  classification  est  mal  choisi 
en  ce  qu'il  ne  peut  s'adapter  à  tous  les  cas  qui  se  présentent. 

D'un  autre  côté,  les  nomenclatures  trop  étendues  ne  sont 
pas  sans  inconvénients  :  encombrantes  et  malaisées  à  con- 
sulter, elles  présentent  de  sérieuses  difficultés  au  moment 
de  l'interprétation  en  ce  qu'elles  ne  groupent  plus,  sous 
chacune  de  leurs  rubriques,  que  des  faits  trop  peu  nom- 
breux. Cependant,  réserves  faites  quant  à  l'abus  de  la  spé- 
cialisation, les  classifications  doivent,  en  principe,  être  aussi 
détaillées  que  possible,  afin  de  permettre  de  conserver  aux 
faits  observés  leur  caractère  individuel  constaté  lors  du 
relevé. 

150.  Il  est  souvent  dangereux  de  recourir,  dans  les  clas- 
sifications statistiques,  à  des  principes  empruntés  au  clas- 
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sèment  des  sciences.  Les  vues  théoriques  qui  dominent  à 
un  moment  donné  sont  sujettes  à  se  modifier,  de  sorte 
qu'après  un  certain  temps,  on  est  fort  étonné  de  trouver 
réunies  des  rubriques  de  classement  dont  l'accouplement 
ferait  sourire  si  on  ne  se  rappelait  qu'il  fut  fondé  autrefois 
sur  des  vues  généralement  acceptées.  L'inconvénient  qui 
résulte  de  ce  fait  est  qu'il  n'est  guère  possible  de  conserver 
de  telles  bases  quand  elles  sont  surannées  et  que,  dès  lors-, 
le  grand  avantage  qui  résulte  des  comparaisons  se  trouve 
annihilé. 

Une  classification  nosologique  des  causes  de  décès,  qui 
eût  été  élaborée  il  y  a  quelque  cinquante  ans,  nous  éton- 
nerait, aujourd'hui,  par  les  rapprochements  bizarres  qu'elle 
renfermerait  ;  les  théories  médicales  se  sont  modifiées  et  les 
opinions  sur  les  causes  des  maladies  ne  sont  plus  ce  qu'elles 
étaient  autrefois.  William  Farr  avait  donc  raison  quand  il 
déclarait  préférer  à  la  classification  nosologique  celle,  beau- 
coup plus  terre  à  terre,  basée  sur  le  siège  de  la  maladie.  Au 
moins  celle-ci  a-t-elle  des  chances  de  durée  (1). 

On  a  voulu  aussi  baser  les  classifications  de  l'industrie 
d'après  la  matière  première  que  les  industries  mettent  en 
œuvre  et  l'on  a  repris,  dans  ce  but,  l'antique  classification 
des  trois  règnes-  :  minéral,  végétal  et  animal.  Ce  principe 
de  classification  conduit  aux  rapprochements  les  plus  bi- 
zarres :  ainsi,  l'on  voit  figurer  ensemble  dans  une  même 
division,  la  fabrication  du  gaz  d'éclairage,  le  travail  et  la 
préparation  des  pierres,  l'industrie  du  lapidaire,  le  raffi- 
nage du  sel  et  la  fabrication  du  verre  à  vitre  ;  cette  associa- 
tion se  justifie  par  le  fait  que  toutes  ces  industries 
emploient  des  matières  minérales.  Le  principe  de  classifica- 
tion est  d'ailleurs  insuffisant,  car  il  ne  peut  servir  pour  les 
industries  qui  utilisent  à  la  fois  des  matières  premières 
empruntées  à  deux  ou  aux  trois  règnes.  Où  faut-il  classer  la 
construction  des  wagons?  et  la  construction  des  bâtiments? 


(1)  Bektillon,  Traité  élémentaire  de  statistique  administrative,  Paris,  1886. 
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Il  est  bien  préférable  de  s'en  tenir  à  des  classifications  plus 
simples  et  plus  vraies,  basées  sur  l'usage.  Tout  le  monde 
sait  ce  que  l'on  veut  dire  lorsqu'on  parle  de  l'industrie  des 
métaux,  de  la  construction,  du  vêtement;  cet  avantage  n'est 
pas  mince.  Il  ne  suffit  pas  que  le  principe  de  classification 
soit  —  s'il  est  possible  —  irréprochable,  il  faut  encore  qu'il 
soit  compris.  Admettons,  comme  Stanley  Jevons  le  sup- 
pose (1),  que  nous  puissions  classer  tous  les  corps  en  raison 
de  leur  constitution  atomique.  Sans  conteste,  une  pareille 
classification  serait  essentiellement  scientifique  et  peut- 
être  serait-elle  capable  de  suggérer  des  rapprochements 
fort  intéressants.  Le  malheur  est,  qu'en  dehors  d'un  petit 
nombre  de  spécialistes,  elle  ne  pourrait  servir  à  personne. 

151.  Les  classifications  dont  nous  venons  de  parler  sont 
toutes  basées  sur  un  ordre  idéologique  quelconque.  Pour 
obvier  aux  difficultés  signalées,  certains  techniciens  ont 
parfois  essayé  de  nomenclatures  basées  sur  l'ordre  alpha- 
bétique. Le  remède  est  pire  que  le  mal.  Les  clas- 
sifications alphabétiques  sont  détestables,  car  le  cher- 
cheur ne  sait  jamais  si  telle  dénomination  comprend 
toutes  les  variétés  qui  peuvent  exister  et,  pour  atteindre 
des  résultats  sûrs,  le  lecteur  est  forcé  de  se  livrer  à 
des  recherches  aussi  longues  que  fastidieuses;  aucune 
totalisation  systématique  ne  peut  se  faire  si  l'on  s'en  tient 
rigoureusement  à  l'ordre  alphabétique  ;  enfin,  les  comparai- 
sons internationales  —  qu'il  ne  faut  jamais  perdre  de  vue, 
tout  en  se  montrant  fort  prudent  dans  la  pratique  —  sont 
décidément  impossibles  avec  ce  système.  M.  J.  Bertillon  a 
dit  avec  esprit  que  l'ordre  alphabétique  n'était  qu'une 
forme  du  désordre  :  il  a  parfaitement  raison. 

152.  Indépendamment  des  considérations  qui  précèdent, 
il  convient  d'introduire  dans  la  matière  qui  nous  occupe, 


(1)  Stanley  (Jevons),  Principlcs  of  Science.  Classification. 
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une  dernière  distinction  :  celle  entre  les  classifications  ho- 
mogènes et  les  hétérogènes.  On  donne  le  nom  d'homogènes 
anx  classifications  qui  se  rapportent  à  un  seul  phénomène 
considéré  dans  ses  diverses  parties.  Ainsi,  une  classifi- 
cation des  âges  par  périodes  de  cinq  années  est  homogène, 
parce  qu'on  ne  considère  que  le  phénomène  âge.  Mais,  dans 
un  classement  des  habitants  d'un  pays  d'après  leur  profes- 
sion, des  données  hétérogènes  doivent  nécessairement  être 
introduites.  Prenons  comme  exemple  la  nomenclature  mé- 
thodique des  industries  et  professions  adoptée  pour  le  recen- 
sement français.  Nous  avons  :  hors  section,  les  personnes  ne 
vivant  pas  de  l'exercice  d'une  profession  proprement  dite  ou 
exerçant  une  profession  mal  déterminée;  viennent  ensuite 
les  sections  :  1"  pêche  ;  2°  forêts  et  agriculture  ;  3°  industries 
extractives;  4°  industries  de  transformation;  5°  manuten- 
tion et  transport  ;  6°  commerce,  banque  ;  7°  professions  libé- 
rales ;  8°  soins  personnels,  service  domestique  ;  9°  services  de 
l'Etat,  des  départements  ou  des  communes.  Cette  classifi- 
cation est  évidemment  hétérogène  et  elle  ne  peut  avoir  un 
autre  caractère. 

Il  reste  une  dernière  remarque  à  présenter  :  elle  a  trait 
aux  comparaisons  statistiques  et  au  rôle  que  jouent,  dans 
ces  comparaisons,  les  classifications.  Il  est  rare  qu'après 
avoir  arrêté  une  classification,  on  ne  doive  pas,  quelques 
années  après,  y  introduire  des  changements.  La  vie  écono- 
mique, entre  autres,  ne  se  conçoit  pas  sans  changement,  de 
telle  sorte  qu'un  classement  des  industries  est  en  perpé- 
tuelle instance  de  revision.  A  un  moindre  degré,  il  en  est 
de  même  des  classifications-  de  maladies,  auxquelles  la 
science  médicale  travaille  constamment  à  apporter  des 
modifications.  S'il  s'agit  donc  de  comparer,  à  des  dates  dif- 
férentes, des  faits  classés  d'après  un  certain  ordre,  trop 
de  soins  ne  pourront  être  apportés  à  la  vérification  des  ru- 
briques de  classement  de  façon  à  ne  comparer  que  ce  qui  est 
rigoureusement  comparable  ;  les  faits  nouveaux  seront  mis 
à  part,  comme  aussi  les  faits  qui  ont  cessé  d'être  constatés. 


PKÉPAHATION   DU  DÉPOUILLEMENT 


243 


Cette  précaution  ne  suffit  pas  encore  :  il  convient  de 
s'assurer  si  les  mêmes  désignations  s'appliquent  encore 
aux  mêmes  faits.  Sans  que  les  dénominations  des  rubriques 
aient  été  changées,  leur  contenu  peut  avoir  varié  dans  une 
sensible  mesure.  L'auteur  de  la  comparaison  ne  doit  pas 
s'y  laisser  tromper  et  il  a  le  devoir  de  signaler  au  lecteur 
les  changements  internes  dont  il  a  connaissance. 

153.  Les  classifications  disposent  les  faits  d'après  leur 
nature,  en  tenant  compte  de  leurs  ressemblances  et  de  leurs 
différences.  A  chaque  catégorie  correspond  un  certain 
nombre  de  manifestations-  du  phénomène  ;  il  faut  non  seule- 
ment observer  leur  nombre,  mais  les  répartir  d'après  leur 
importance,  leur  intensité,  les  circonstances  dans  lesquelles 
elles  se  produisent.  Ceci  est  la  mission  propre  du  tableau 
statistique. 

Dans  le  dépouillement,  on  compte  unité  par  unité,  mais 
pour  présenter  les  résultats  du  comptage  il  est  nécessaire, 
le  plus  souvent,  de  les  réunir  par  groupes  plus  ou  moins 
étendus.  Dans  une  statistique  des  âges,  le  statisticien  n'énu- 
mérera  pas  tous  les  âges,  par  mois,  ni  même  par  années, 
mais  composera  des  groupes  d'âges  (moins  de  1  an  —  de 
1  à  5  ans  —  de  5  à  10  ans,  etc.)  où  viendront  se  réunir  tous 
les  résultats  partiels  compris  dans  les  limites  de  chaque 
groupe.  Autre  exemple  :  il  s'agit  d'opérer  la  répartition  des 
entreprises  trouvées  lors  d'un  recensement  industriel, 
d'après  le  nombre  des  ouvriers  que  chacune  d'elles  emploie. 
Toutes  les  entreprises  qui  n'ont  pas  exactement  le 
même  nombre  d'ouvriers  ne  peuvent  être  mises  à  part, 
sinon  la  classification  comporterait  plusieurs  centaines  de 
termes  (établissements  de  1,  2,  3...  297,  298,  299,  300,  301... 
ouvriers).  Aussi  présente-t-on  les  résultats  du  dépouil- 
lement suivant  certaines  catégories  :  moins  de  5  ouvriers, 
de  5  à  10,  de  11  à  20,  de  21  à  50,  de  51  à  100,  de  101  à  200,  etc. 

Le  groupement  est  requis  par  des  nécessités  scientifiques 
et  pratiques.  Scientifiques  :  on  éprouverait  une  extrême 
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difficulté  à  dégager  quelque  résultat  que  ce  soit  d'une  sta- 
tistique comportant  une  classification  aussi  étendue  et  il 
faudrait  en  venir  à  grouper  les  données  pratiques  :  les 
statistiques  atteindraient  des  dimensions  telles  qu'il  fau- 
drait renoncer  à  les  publier  :  beaucoup  de  colonnes  res- 
teraient vides;  avec  des  divisions  multipliées,  les  chances 
d'erreur  dans  le  dépouillement  seraient  augmentées. 

154.  Jusqu'à  quel  point  convient-il  de  réunir,  de  grouper 
les  unités  comptées  par  le  dépouillement?  Il  n'y  a  pas,  à  cet 
égard,  de  règle  absolue;  les  circonstances,  l'étude  appro- 
fondie de  la  matière  doivent,  en  cette  circonstance,  inspirer 
les  solutions  à  choisir.  Cependant,  quelques  recomman- 
dations générales  peuvent  être  formulées.  L'auteur  du  tra- 
vail prendra  égard,  par  exemple,  au  sujet  de  la  recherche 
statistique  :  s 'il  s 'agit  de  grouper  une  population  par  âge, 
des  divisions  quinquennales  seront,  somme  toute,  suffi- 
santes, sauf  pour  les  âges  extrêmes  où  il  y  a  intérêt  à  isoler 
des  cas  qui  méritent  une  étude  spéciale.  Lorsque  la  classi- 
fication par  âges  doit  servir  à  une  statistique  des  décès, 
les  divisions,  au  début,  seront  assez  courtes  pour  pouvoir 
isoler  la  mortalité  infantile.  Si  la  statistique  mortuaire 
est  destinée  à  faire  ressortir  l'influence  des  saisons  et  des 
facteurs  qui  y  ont  rapport,  les  divisions  quinquennales 
d'âges  seront  unies  à  des  divisions  détaillées  de  l'année 
(mois  par  mois). 

Ce  premier  point  ayant  été  déterminé  avec  soin,  il  faut 
arrêter  le  nombre  de  divisions  à  adopter.  Il  importe  de  dis- 
tinguer entre  les  variables  qui  ne  procèdent  que  par  degrés 
de  faible  étendue,  de  celles  où  les  écarts  sont  plus  considé- 
rables. Les  fleurs  de  beaucoup  d'espèces  botaniques  n'ont 
pas  toujours  le  même  nombre  de  pétales;  pour  obser- 
ver une  variable  de  ce  genre,  il  va  de  soi  que  la  division  à 
adopter  sera  l'unité.  Lorsque  les  variations  comportent  un 
plus  grand  nombre  de  degrés,  du  point  le  plus  bas  au  point 
le  plus  élevé,  on  pourra  adopter  des  divisions  plus  larges 
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que  dans  le  cas  précédent.  Toutefois,  il  convient  d'éviter 
toujours  de  trop  condenser  la  matière;  s'il  y  a  moins  de 
dix  divisions,  il  sera  difficile  d'éviter  que  la  statistique 
présente  une  fâcheuse  imprécision,  car  chaque  classe  ren- 
fermera alors  des  unités  sensiblement  différentes.  D'autre 
part,  on  ne  peut  multiplier  trop  les  divisions,  car  alors  on 
aboutirait  à  un  tableau  illisible  ;  il  est  fort  désirable,  comme 
nous  le  verrons  plus  loin,  que  les  tableaux  statistiques 
puissent  tenir  sur  une  double  page  du  volume. 

155.  Le  point  de  départ  des  divisions  est  aussi  une  ques- 
tion qui  mérite  réflexion.  Vaut-il  mieux  adopter  des  divi- 
sions normales,  commençant  par  l'unité  simple  et  finissant 
avec  elle,  comme  de  12  à  13  —  13  à  14,  etc.,  ou  bien  est-il 
préférable  de  choisir  l'unité  augmentée  d'une  fraction, 
1/2  par  exemple,  comme  12.5  à  13.5  —  13.5  à  14.5?  Toutes 
les  unités  ne  se  prêtent  pas  à  une  division  de  ce  genre,  ou 
elles  ne  s'y  prêtent  pas  dans  tous  les  cas.  Cette  réserve 
faite,  il  y  a  souvent  avantage  à  adopter  des  divisions  telles 
que  :  12.5  à  13.5  —  13.5  à  14.5,  afin  d'éviter  de  rendre  trop 
sensibles  les  erreurs  qui  se  marquent  fréquemment  aux 
degrés  de  l'échelle  correspondant  à  des  nombres  ronds 
(20,  30,  40)  ;  les  exagérations  à  ces  degrés  sont  fréquentes 
dans  les  recensements  de  la  population  et  existent  aussi 
dans  d'autres  dénombrements. 

Il  est  important  d'adopter,  dans  les  classifications,  des 
divisions  qui  ne  prêtent  à  aucune  équivoque.  Dans  un  relevé 
où  il  s'agit,  par  exemple,  de  sommes  d'argent  classées 
d'après  leur  importance,  le  classement  se  fait  souvent 
comme  ceci  :  moins  de  1,000  francs  ;  de  1,000  à  2,000  francs  ; 
de  2,000  à  3,000  francs,  etc.  Il  est  plus-  exact  de  dire  :  de 
1,000  à  1,999  francs,  de  2,000  à  2,999  francs,  etc.  La  limite  à 
laquelle  on  arrête  les  divisions  indique  le  degré  de  précision 
du  relevé.  Dans  l'exemple  donné  ci-dessus,  cette  limite  est 
le  franc;  si  elle  était  le  centime,  l'énumération  devrait 
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être  faite  ainsi  :  de  1,000  à  1,999.99  francs;  de  2,000  à 
2,999.99  francs,  etc. 

Pour  se  conformer  à  la  théorie,  les  divisions  numériques 
adoptées  dans  les  diverses  classifications  devraient  être 
égales  :  si  l'on  admet  au  début  que  les  échelons  seront  dis- 
tants de  dix  degrés,  il  est  évident  que,  théoriquement,  cette 
convention  devrait  être  respectée  jusqu'à  la  fin.  C'est  là 
une  exigence  que  les  statistiques  officielles  ne  sont  pas  à 
même,  le  plus  souvent,  de  respecter  et  cela  pour  un  grand 
nombre  de  raisons  :  d'abord,  parce  que  ce  plan  aurait  pour 
effet  d'augmenter  beaucoup  l'étendue  des  publications  et, 
par  conséquent,  leur  coût;  ensuite,  parce  que  le  dépouille- 
ment serait  plus  long  et  plus  coûteux  ;  enfin,  parce  que  beau- 
coup de  colonnes  resteraient  vides  ou  ne  contiendraient  que 
de  rares  unités.  Très  souvent,  les  divisions  des  échelles 
sont  donc  inégales.  A  certains  égards,  il  en  résulte  de  sé- 
rieux inconvénients;  beaucoup  de  calculs  de  la  statistique 
mathématique  supposent  qu'on  puisse  tabler  sur  des  divi- 
sions égales.  On  devrait  s'attendre  par  exemple  à  observer 
une  diminution  régulière  dans  les  chiffres  d'un  relevé  et 
l'on  constate  au  contraire  des  ressauts  qui  rompent  l'uni- 
formité de  la  descente  :  ils  sont  dus  le  plus  souvent  à  l'aug- 
mentation subite  du  nombre  de  degrés  compris  dans  une 
nouvelle  classe.  Un  moyen  simple  de  remédier  à  cette  irré- 
gularité consiste  à  diviser  les  résultats  de  chaque  classe  par 
le  nombre  de  degrés  qu'elle  renferme,  lorsque  ce  nombre  est 
supérieur  à  la  grandeur  admise  comme  point  de  départ. 

IV.  —  Préparation  des  tableaux. 

156.  Quand  un  phénomène  est  décrit  à  l'aide  de  données 
statistiques  exposées  selon  un  double  système  de  classifica- 
tion, nous  avons  ce  qu'on  appelle  communément  un  tableau  à 
double  entrée.  Ce  genre  de  tableau  statistique  est  des  plus 
utile  en  ce  que  les  données  n'y  sont  pas  présentées  suivant 
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un  plan  unique  (auquel  cas  on  a  simplement  une  description 
du  phénomène)  mais  qu'elles  sont  mises  en  fonction  les  unes 
des  autres,  ce  qui  favorise  beaucoup  la  recherche  des  rela- 
tions causales  et  projette  une  vive  clarté  sur  l'essence  du 
phénomène  lui-même.  Dans  les  tableaux  à  entrée  simple,  on 
énumère,  on  expose,  on  totalise  ;  le  tableau  à  double  entrée 
participe  déjà  de  l'interprétation,  tant  il  met  en  relief  les 
caractéristiques  du  phénomène  lié  à  un  certain  ordre  de 
causes.  Une  répartition  de  la  population  d'après  les  profes- 
sions a  un  aspect  tout  différent  selon  qu'elle  suit  simple- 
ment la  classification  des  industries  ou  qu'elle  combine  la 
notion  «  profession  »  avec  la  notion  «  âge  »  ou  «  origine  ». 
Entre  les  divisions  des  tableaux  à  double  entrée  se  remar- 
quent des  relations  logiques  de  l'ordre  de  celles  que  nous 
avons  exposées  plus  haut,  en  ce  qui  concerne  les  classes  de 
dernière  fréquence,  comme  le  montre  l'exemple  suivant  : 


Nombre  de  bâtiments  existant  en  Belgique  (1910)  : 


IMPORTANCE 
DES  COMMUNES 

NOMBRE  DE  BATIMENTS  AU  31  DÉCEMBRE  1910 

Maisons  pro- 
prement dites 

destinées 
à  l'habitation 

{habitées 
ou  non) 

Bâtiments 
de  toute  nature 
non  destinés  à 

l'habitation 
mais  où  demeu- 
rent une 
ou  plusieurs 
personnes 

Autres 
bâtiments  non 

destinés 
à  l'habitation  et 
non  habités 

Total 

(H 

(2) 

P) 

4 

15) 

U.  —  Communes  de  20,000 

habitants  et  plus.  . 

366,894 

4,274 

10,140 

381,308 

M'.  —  Communes  de  5,000 

à  moins  de  20, 000  h. 

•440,682 

2,779 

15,037 

458,498 

M2.  —  Communes  de  2,000 

à  moins  de  5,000  h. 

3-13,627 

2,347 

9,538 

355,512 

H.-  Communes  de  inoins 

de  2,000  habitants  . 

385,133 

3,533 

14,801 

403,467 

Totaux.   .  . 

1,536,336 

12,933 

49,516     j  1,598,785 
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Pour  la  facilité  de  l'analyse,  désignons  par  A  la  colonne 
2,  par  B  la  colonne  3,  par  C  la  colonne  4,  par  D  la  colonne  5  ; 
appelons  U  les  communes  urbaines  de  20,000  habitants  et 
plus,  R  les  communes  rurales  de  moins  de  2,000  habitants, 
M1  les  communes  de  5,000  à  moins  de  20,000  habitants, 
M2  celles  de  2,000  à  moins  de  5,000  habitants...  Nous  avons  : 


pour  U  : 

A 

D  — 

96.22 

C 

A  ~ 

276  XB  = 

2.73  |  = 
A 

1.16 

pour  R 

A 
'  1)  ~~ 

95.46 

C 
A 

3.81?  = 
A 

0.92 

pour  M1  : 

A 

D  ~~" 

96.11 

C 
A 

SMÂ  = 

3.39  ?  = 
A 

0.63 

pour  M* : 

A 
I) 

96  66 

C 

A  ~ 

r 

2.78—  = 
A  B 

2.76?  = 
A 

0.58 

De  quoi  l'on  peut  conclure  :  1°  que  la  proportion  des 
maisons  destinées  à  l'habitation  est  pour  ainsi  dire  la  même 
dans  les  localités  urbaines  et  les  communes  importantes 
sans  que  le  facteur  population  joue  à  cet  égard  un  rôle  sen- 
sible ;  il  n'y  a  que  dans  les  communes  rurales  que  la  propor- 
tion des  bâtiments  destinés  à  l'habitation  soit  plus  faible; 

2°  Les  bâtiments  non  destinés  à  l'habitation  et  non 
habités  sont  plus  nombreux  dans  les  campagnes  que  partout 
ailleurs;  la  proportion  diminue  dans  les  localités  secon- 
daires pour  arriver  au  minimum  dans  les  villes  impor- 
tantes, mais  cette  diminution  n'est  pas  parallèle  à  la  marche 
du  chiffre  de  la  population,  du  moins  dans  le  classement 
proposé; 

3°  C'est  dans  les  grandes  villes  que  la  proportion  des 
bâtiments  non  destinés  à  l'habitation  mais  où  demeurent 
une  ou  plusieurs  personnes  est  la  plus  forte;  elle  est 
moindre  dans  les  campagnes,  mais  elle  est  surtout  très 
faible  dans  les  petites  villes  et  les  grosses  communes  ; 

4°  Le  rapport  des  bâtiments  non  destinés  à  l'habitation  à 
ceux  qui,  à  un  titre  quelconque,  servent  d'habitation  est  le 
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plus  élevé  dans  les  communes  rurales,  puis  dans  les  villes 
de  second  rang  (5.000  à  20.000)  ;  il  est  le  plus  faible  dans  les 
villes  et  un  peu  plus  élevé  dans  les  localités  de  2,000  à  moins 
de  5,000  habitants. 

CHAPITRE  II 

Exécution  du  dépouillement 

I.  —  Organisation  du  dépouillement. 

157.  Dans  toute  opération  technique,  la  valeur  des  résul- 
tats est  en  raison  directe  de  la  perfection  des  moyens 
employés.  Il  y  a  donc  un  intérêt  primordial  à  ne  recourir 
qu'à  des  méthodes  éprouvées  tout  en  étant  décidé  à  accueil- 
lir sans  hésitation  les  améliorations  dues  aux  progrès  des 
sciences  ;  il  faut  savoir  être  assez  conservateur  pour  ne  pas 
sacrifier  à  la  légère  une  organisation  dont  les  résultats 
furent  longtemps  jugés  satisfaisants,  mais,  d'autre  part, 
rien  ne  serait  plus  désastreux  que  l'entêtement  à  ne  pas 
s'écarter  des  voies  suivies  jusque-là  et  l'obstination  à  ne 
pas  reconnaître  les  progrès  accomplis.  C'est  de  cette  double 
pensée  qu'il  convient  de  s'inspirer  en  arrêtant  les  méthodes 
à  employer  dans  l'exécution  du  dépouillement. 

Le  dépouillement  peut  être  exécuté  de  deux  façons  :  par 
la  méthode  décentralisée  et  par  la  méthode  centralisée. 

La  méthode  décentralisée  est  celle  qui  consiste  à  confier 
à  des  autorités  administratives  inférieures  le  soin,  non  seu- 
lement de  recueillir  les  renseignements  statistiques,  mais 
de  les  réunir,  de  les  classer  et  de  les  dépouiller  suivant  le 
plan  et  d'après  les  instructions  transmis  par  l'organe 
central.  Dans  ce  système,  le  travail  de  l'organisme  central 
consiste  principalement  dans  des  contrôles  formels  plutôt 
qu'essentiels  et  à  mettre  bout  à  bout  les  divers  relevés  par- 
tiels que  lui  transmettent  les  autorités  subordonnées.  Dans 
la  méthode  centralisée,  au  contraire,  aucun  dépouillement 
n'est  effectué  qu'au  centre  ;  c'est  à  peine  si  les  agents  recen- 
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seurs  et  les  administrations  communales  sont  chargés  de 
quelques  classements  préalables  n'ayant  rien  de  commun 
avec  le  dépouillement  proprement  dit. 

Lorsque  la  méthode  décentralisée  est  appliquée  dans 
toute  sa  rigueur,  le  dépouillement  ne  se  t'ait  pas  en  une 
étape,  mais  en  plusieurs,  aussi  nombreuses  que  les  degrés 
de  l'échelle  administrative  qui  relie  l'organe  exécutant  à 
l'organe  central.  Tel  était  le  système  suivi  en  France  pour 
le  recensement  général  de  la  population  avant  1901.  Les 
mairies  étaient  chargées  du  dépouillement  des  données  se 
rapportant  à  la  commune  ;  les  sous-préfectures  réunissaient 
les  données  des  communes  de  leur  ressort,  et  les  préfectures, 
à  leur  tour,  groupaient  les  données  par  département.  L'or- 
gane central  recevait  uniquement  ces  «  états  »,  objets  de 
manipulations  successives  auxquelles  il  était  resté  totale- 
ment étranger  ;  ne  possédant  pas  les  documents  originaires, 
il  n  'était  pas  à  même  de  procéder  à  une  revision  quelconque 
du  matériel  statistique  et  du  moment  que  les  opérations 
arithmétiques  étaient  correctes,  il  devait  s 'estimer  satisfait. 
Déjà  en  1880,  une  commission  nommée  auprès  du  ministère 
de  l'Intérieur,  puis  le  Conseil  supérieur  de  statistique,  at- 
tirèrent l'attention  sur  les- inconvénients  de  ce  système;  en 
1894,  une  commission  instituée  par  le  ministre  du  Commerce 
se  prononça  aussi  en  faveur  du  dépouillement  central  des 
bulletins  du  recensement  des  industries  et  professions  dont 
elle  avait  à  tracer  le  plan.  Cette  recommandation  fut 
entendue  en  1896  pour  la  partie  professionnelle  des  bulle- 
tins de  recensement.  Depuis  1901,  le  dépouillement  du  recen- 
sement de  la  population  est,  en  France,  complètement  cen- 
tralisé. 

158.  A  quel  système  convient-il  d 'accorder  la  préférence  ? 
La  question,  qui  a  pu  paraître  douteuse  il  y  a  longtemps,  ne 
l'est  plus  aujourd'hui.  La  science  et  la  pratique  se  sont 
prononcées  en  faveur  du  dépouillement  centralisé  et  à  l'ap- 
pui de  leur  décision  l'on  apporte  les  arguments  suivants  : 
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1"  Le  dépouillement  centralisé  est  le  seul  système  qui 
permette  d'introduire  dans  l'administration  de  la  statis- 
tique le  principe  général  d'organisation  qui,  depuis  long- 
temps, est  en  vigueur  dans  l'industrie  et  dans  les  sciences  : 
la  spécialisation  des  fonctions.  Celui-ci  entraîne  les  consé- 
quences suivantes  :  les  aptitudes  diverses  des  agents  sont 
employées  au  mieux;  l'entraînement  résultant  de  la  répé- 
tition de  la  même  opération  augmente  le  rendement;  le  chef 
de  l'organisme  central,  surveillant  tous  les  résultats  des 
diverses  opérations,  peut  corriger  progressivement  les 
défauts  que  le  fonctionnement  accuse  ;  un  outillage  perfec- 
tionné peut  être  mis  en  usage  avec  son  maximum  de 
rendement,  etc.  ; 

2°  Au  point  de  vue  administratif,  la  centralisation  pré- 
sente l'avantage  de  mettre  fin  aux  revendications  justifiées 
que  faisaient  entendre  les  administrations  inférieures,  déjà 
encombrées  de  travail,  et  auxquelles  l'exécution  des  statis- 
tiques apportait  un  notable  surcroît  de  besogne  ; 

3"  Le  travail  statistique  dans  les  administrations  infé- 
rieures étant  intermittent,  il  n'y  a  pas  possibilité  d'y 
former  des  employés  vraiment  aptes  à  cette  tâche.  Les 
statistiques  sont  dépouillées  par  des  agents  non  qualifiés 
spécialement,  n'ayant  pas  d'intérêt  à  l'exécution  correcte 
du  travail;  au  contraire,  le  dépouillement  centralisé  fait 
passer  le  travail  statistique  aux  mains  d'un  personnel  spé- 
cialement recruté,  responsable,  intéressé  à  accomplir  sa 
tâche  le  mieux  possible  ; 

4°  Il  est  impossible  d'assurer  l'uniformité  des  décisions 
concernant  les  classements  et  les  autres  questions,  si  nom- 
breuses, qui  se  posent  au  cours  du  dépouillement,  ailleurs 
que  dans  le  système  centralisé.  Une  telle  entreprise  rentre- 
t-elle  dans  cette  rubrique  de  classement,  ou  cette  autre? 
S'agit-il  d'une  entreprise  appartenant  à  l'industrie  à  domi- 
cile, ou  à  l'industrie  en  atelier?  De  pareilles  questions,  qui 
exigent  des  solutions  d'espèce,  ne  peuvent  être  résolues  par 
des  instructions  générales  si  détaillées  qu'on  veuille  les  sup- 
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poser.  Pour  être  homogènes,  les  réponses-  doivent  être  for- 
mulées par  un  organisme  central.  La  solution  consistant  à 
recommander  aux  autorités,  communales  et  provinciales  de 
soumettre  à  l'organe  central  les  questions  douteuses,  est 
illusoire  :  cet  expédient  ferait  perdre  trop  de  temps  et  il 
n'est  utilisé  par  personne.  De  même,  est  insuffisante  à 
assurer  l'homogénéité  des  décisions,  la  communication  par 
l'organe  central,  à  toutes  les  autorités  subordonnées,  des 
solutions  qu'il  a  données  à  des  difficultés  qui  lui  ont  été 
soumises  :  rien  ne  dit  qu'on  tient  compte  de  pareilles  re- 
commandations, ni  qu'elles  n  'arrivent  pas  trop  tard. 

5°  L'utilisation  complète  du  matériel  statistique  exige  la 
confection  de  nombreux  tableaux  dérivés  qu'un  personnel 
spécial  est  seul  à  même  de  concevoir  et  d'exécuter.  Ce  per- 
sonnel ne  peut  se  trouver  que  dans  un  bureau  central  où  il  a 
acquis,  par  la  pratique,  les  qualités  nécessaires  à  sa  tâche. 
Pour  bien  utiliser  une  statistique,  il  faut  avoir  assisté  à 
toutes  les  phases  du  dépouillement,  sinon  on  court  le  risque 
de  commettre  de  fortes  erreurs  dans  l'interprétation.  Au 
nombre  des  conditions  requises  pour  l'utilisation  ration- 
nelle des  données,  on  peut  citer  l'emploi  d'un  outillage 
mécanique  complet,  qui  ne  peut  se  trouver  que  dans  les 
bureaux  d'un  organisme  central. 

159.  A  ces  raisons,  on  oppose  quelques  objections,  mais 
sans  une  valeur  décisive  :  1°  le  bureau  central  sera  sub- 
mergé sous  la  masse  des  documents  à  utiliser.  Réponse  :  il 
est  vrai  que  la  tâche  du  bureau  central  est  beaucoup  plus 
rude  que  par  le  passé,  mais  l'expérience  acquise  depuis 
pins  de  trente  ans  montre  que  la  besogne  dont  il  est  ques- 
tion ne  dépasse  pas  les  forces  administratives  dont  dispose 
l'Etat  moderne  ; 

2°  Ecrasé  par  sa  besogne  matérielle,  l'organe  central  ne 
pourra  donner  une  attention  suffisante  à  la  correction  des 
documents.  Réponse  :  les  faits,  qui  sont  plus  éloquents  que 
tout  le  reste,  prouvent  exactement  le  contraire.  Une  revi- 
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sion  sérieuse  n'est  possible  qu'à  la  condition  que  le  bureau 
central  possède  les  bulletins  mêmes  de  la  statistique  et  qu'il 
soit  chargé  de  les  dépouiller.  Toute  l'évolution  de  la  statis- 
tique administrative  se  fait  en  ce  sens  depuis  de  nom- 
breuses années; 

3°  La  correction  des  bulletins  est  malaisée  à  cause  de 
l'éloignement  du  bureau  central  :  il  ignore  les  circonstances 
locales  et  ne  peut  s'en  inspirer.  Réponse  :  l'objection  ne 
serait  fondée  que  dans  l'hypothèse  seulement  où  le  bureau 
central  prendrait  la  charge  de  toutes  les  corrections,  mais 
dans  la  plupart  des  cas  il  se  borne  à  renvoyer  aux  autorités 
locales  les  bulletins  défectueux  (1).  De  nos  jours,  les  moyens 
actuels  de  communications  permettent  à  l'organe  central  de 
se  renseigner,  rapidement  et  à  peu  de  frais  auprès  des  inté- 
ressés eux-mêmes  :  ainsi,  lors  du  recensement  belge  de  1910, 
nous  avons  fait  usage  du  téléphone  d'une  manière  intensive 
pour  réclamer  aux  chefs  d'entreprise  les  renseignements 
complémentaires  qu'il  fallait  réunir. 

Nous  croyons  inutile  de  répondre  à  une  dernière  objec- 
tion d'après  laquelle,  dans  le  système  centralisé,  le  chef  de 
l'administration  manquerait  de  temps  pour  cultiver  la 
science. 

Il  n'est  pas  douteux  que  le  dépouillement  centralisé  soit 
une  forme  supérieure  de  l'organisation  de  la  statistique. 
Aussi  presque  tous  les  pays  l'ont-ils  successivement  adopté. 
Il  ne  reste  guère  de  vestiges  de  l'organisation  ancienne  que 
dans  la  mission  confiée,  parfois  encore,  aux  autorités  locales, 
de  classer  les  bulletins  statistiques  dans  l'ordre  indiqué 
par  le  bureau  central.  Il  n'y  a  rien  à  redire  à  cette  modalité 
de  la  décentralisation;  elle  a  pour  effet  de  débarrasser 


(1)  L'Office  du  Travail  de  Belgique,  lors  du  recensement  de  l'industrie  et 
du  commerce  (1910),  a  renvoyé,  pour  correction,  aux  autorités  locales, 
^83,000  bulletins  de  recensement,  sans  compter  les  très  nombreuses  corrections 
qu'il  a  effectuées  lui-même,  d'après  les  renseignements  réclamés  directement 
aux  chefs  d'entreprise. 
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l'organe  scientifique  d'une  besogne  aussi  longue  que  fas- 
tidieuse. 

Les  forces  administratives  mises  à  la  disposition  de  l'or- 
ganisme central  pour  venir  à  bout  de  la  tâche  énorme  qui 
lui  est  assignée,  sont  parfois  considérables.  Aux  Etats-Unis, 
lors  du  recensement  fédéral  de  1910,  650  i>ersonnes  étaient 
occupées,  au  début  de  l'année  1910,  aux  travaux  prépara- 
toires; 3,800  personnes  étaient  au  travail  au  mois  de  sep- 
tembre 1910,  leur  nombre  était  réduit  à  2,868  en  juin  1911 
et  à  2.458  en  septembre  de  la  même  année.  Le  personnel  est 
toujours  engagé  à  proportion  du  travail  actuel;  aussi  la 
durée  des  services  est  parfois  très  limitée  :  60  jours  seule- 
ment dans  certains  cas.  Le  nombre  des  employés  d'adminis- 
tration est  très  faible  par  rapport  à  celui  des  agents  tem- 
poraires. Ainsi,  il  n'y  avait  que  24  personnes  du  service 
administratif  pour  2,540  employés,  169  aides  et  42  ouvriers 
mécaniciens  occupés  à  la  fabrique  de  machines  à  calculer 
annexée  aux  bureaux  du  Census  (1). 

II.  —  Méthodes  de  dépouillement. 

160.  Nous  ne  parlerons  pas  ici  des  procédés  mécaniques, 
dont  la  description  se  trouve  au  chapitre  suivant;  nous 
envisageons  uniquement  les  méthodes  de  dépouillement  sous 
leur  aspect  le  plus  général  :  la  méthode  de  pointage  et  la 
méthode  de  comptage  par  bulletins  individuels  ou  par 
fiches.  La  méthode  de  pointage  consiste  à  dépouiller  chaque 
bulletin  séparément  et  à  marquer  l'enregistrement  d'une 
unité  de  chaque  espèce  en  portant,  dans  la  colonne  réservée 
à  ces  unités,  une  barre  verticale  |  et  en  indiquant  la  cin- 
quième unité  dépouillée  au  moyen  d 'une  ligne  oblique  \Jff\  . 
Cette  méthode  est  simplifiée  dans  la  pratique  courante  :  au 
lieu  de  remplir  les  colonnes  de  la  feuille  de  dépouillement 


(1)  Reports  of  the  Department  of  Commercial  Labor.  Washington,  1912, 
p.  49. 
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de  barres  verticales  et  obliques,  on  a  coutume  d'effectuer 
ce  comptage  sur  des  feuilles  sommaires  ;  on  reporte,  après 
un  certain  temps,  ces  résultats  sur  la  feuille  de  dépouil- 
lement mais  en  les  marquant  en  chiffres.  Cette  méthode 
présente  l'avantage  de  conserver  aux  feuilles  de  dépouil- 
lement un  aspect  plus  propre,  de  sorte  que,  après  avoir 
totalisé  les  différents  chiffres  portés  dans  chaque  colonne  et 
les  avoir  inscrits  à  l'encre,  le  manuscrit  peut,  sans  être  reco- 
pié, être  envoyé  à  l'impression. 

M.  Bertillon  a  proposé  un  système  un  peu  différent  du 
pointage.  Il  consiste  à  inscrire,  au  heu  de  barres,  autant  de 
chiffres  correspondant  au  numéro  d'ordre  de  la  colonne  où 
on  les  inscrit.  «  Il  est  clair,  dit  M.  Bertillon,  qu'il  n'est  pas 
plus  long  d 'écrire  un  2  que  de  tracer  un  bâtonnet,  et,  d 'autre 
part,  cela  ôtera  toute  chance  d'erreur,  car  on  n'aura  jamais 
la  tentation  d'écrire  le  chiffre  2  dans  la  colonne  des  3.  »  Et 
il  ajoute  :  «  Cette  manière  de  faire  n'est  pas  toujours  pra- 
tique. »  Nous  sommes  pleinement  d'accord  sur  ce  point  : 
il  est  évident  que  ce  procédé  de  notation  perd  de  sa  valeur  à 
mesure  qu'on  s'avance  dans  l'ordre  des  nombres.  Dès  la 
dizaine,  le  procédé  n'est  plus  pratique;  or,  nous  avons  vu 
(cfr.  n°  117)  qu'une  dizaine  de  subdivisions  dans  l 'échelle  de 
classification  des  unités  peut  être  regardée  comme  insuf- 
fisante, en  général. 

161.  La  méthode  de  dépouillement  par  pointage  est  im- 
praticable dans  le  cas  où  il  s'agit  d'un  matériel  statistique 
contenu  dans  des  registres.  Elle  ne  s'applique  qu'au  rype 
de  bulletin  collectif  et  elle  suppose,  pour  son  application 
rationnelle,  qu'il  s'agit  d'un  dépouillement  peu  compliqué 
et  peu  étendu.  Elle  présente,  en  effet,  une  série  de  désavan- 
tages qui  deviennent  surtout  sensibles  quand  le  matériel 
statistique  est  fort  considérable.  Ce  sont  les  suivants  : 

1°  Le  pointage  suppose  le  maniement  fréquent  de  tout  le 
matériel  statistique.  Or,  ce  matériel  est  pondéreux,  encom- 
brant et  d'un  maniement  désagréable,  peut-être  même  dan- 
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gereux,  à  cause  de  la  poussière  dont  il  se  couvre  dans  les 
salles  destinées  au  classement  des  archives  ; 

2°  L 'employé  peut,  en  inscrivant  la  barre,  se  tromper  de 
colonne  ; 

3"  Il  peut  aussi  douter  de  l'inscription  d'une  unité; 

4°  Le  contrôle  de  ces  erreurs  est  généralement  impossible 
dans  le  cas  visé  au  2°  ;  il  peut  être  efficace  dans  le  cas  prévu 
au  3°,  à  la  condition  que  d'autres  colonnes  soient  réservées 
à  des  unités  de  même  genre,  mais  ces  corrections  exigent 
beaucoup  de  temps  et  une  attention  scrupuleuse. 

162.  La  seconde  méthode  est  la  méthode  de  comptage  ;  elle 
porte  aussi  le  nom  de  méthode  des  «  fiches  »,  par  allusion  à 
la  forme  matérielle  sous  laquelle  elle  se  réalise. 

L'emploi  des  fiches  pour  le  dépouillement  se  rattache  à 
l'utilisation  du  bulletin  individuel  dans  les  recensements. 
Alors  que  le  recensement  de  la  population  se  faisait  encore, 
en  général,  au  moyen  d'évaluation,  le  comte  de  Chabrol, 
préfet  de  la  Seine,  donna  son  adhésion  à  un  projet  soumis 
par  ses  bureaux,  d'après  lequel  le  recensement  de  Paris  se 
ferait,  en  1817,  au  moyen  de  bulletins  nominatifs.  Ces  états 
nominatifs,  d'après  M.  Bloch,  s'appliquaient  à  «  chaque 
location  séparée  »,  c'est-à-dire  à  chaque  ménage  (1).  Le 
bulletin  nominatif  par  ménage  fut  étendu  à  toute  la  France 
en  1836,  alors  qu'à  Paris  le  bulletin  collectif  avait  déjà  été 
remplacé  par  le  bulletin  individuel.  En  Italie,  lors  du 
recensement  effectué  le  31  décembre  1871,  le  relevé  exécuté 
par  les  communes  avait  été  transcrit  en  vue  du  dépouil- 
lement, sur  des  fiches  individuelles  portant  le  même  numéro 
d'ordre  que  le  bulletin  (cartoline)  :  l'essai  des  fiches  pour  le 
dépouillement  avait  déjà  été  fait  en  1867  par  Ernst  Engel, 
mais  l'expérience  faite  en  Italie  lui  suggéra  l'idée  de  rem- 
placer le  bulletin  collectif  par  un  bulletin  individuel  qui 


(1)  Cfr.  Bloch  (M.),  Traité  de  statistique,  pp.  303  et  359. 
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équivaut  à  une  fiche.  Depuis  lors,  l'idée  du  bulletin  indi- 
viduel a  fait  son  chemin;  elle  se  trouve  réalisée  dans 
un  grand  nombre  de  pays.  Dans  certains  bureaux  de  statis- 
tique, on  a  préféré  s'en  tenir  au  bulletin  de  ménage,  mais 
on  a  malgré  cela  recouru  à  l'emploi  des  fiches  pour  le  dé- 
pouillement. M.  von  Mayr  a  longuement  exposé  son  système 
caractérissé  par  l'emploi  de  couleurs  différentes  suivant 
les  catégories  de  fiches  et  l'emploi  de  signes  ou  notations 
conventionnelles.  Lorsque  le  dépouillement  n'est  pas  centra- 
lisé, comme  c'est  encore  le  cas  en  Belgique  pour  le  recense- 
ment de  la  population,  les  agents  des  communes  chargés 
des  premières  opérations  doivent  employer  des  fiches  pour 
procéder  à  leur  travail  ;  les  instructions  sur  la  matière  leur 
prescrivent  la  marche  à  suivre  pour  utiliser  les  cartes  indi- 
viduelles et  les  classer.  Il  est  permis  de  dire  qu'à  l'heure 
actuelle,  la  méthode  de  comptage,  soit  à  l'aide  de  bulletins 
individuels  soit  au  moyen  de  fiches,  est  généralement 
admise  pour  les-  recensements.  Comme  il  s'agit  là  d'une 
partie  essentielle  de  la  statistique,  l'expérience  faite  dans 
ce  domaine  est  décisive  à  l'égard  du  reste. 

163.  Dans  certains  cas,  d'ailleurs,  l'emploi  de  la  fiche  est 
obligatoire  ;  chaque  fois  que  les  données  statistiques  doivent 
être  extraites  d'un  registre,  il  n'y  a  d'autre  moyen  d'orga- 
niser pratiquement  le  dépouillement  que  de  transcrire  sur 
fiches  les  indications  à  dépouiller  ;  les  données  se  succédant 
dans  un  ordre  différent  du  classement  statistique,  l'agent 
dépouilleur  devrait  constamment  changer  de  cadre  pour  y 
porter  les  unités,  ce  qui  serait  impraticable. 

Le  pouvoir  représentatif  de  la  fiche  est  beaucoup  plus 
élevé  que  celui  du  simple  bulletin  individuel.  Dans  un  sens 
large,  il  est  exact  de  dire  que  le  bulletin  individuel  est  une 
fiche,  mais  il  ne  possède  pas,  loin  de  là,  toutes  les  qualités 
spéciales  de  celle-ci  en  vue  du  dépouillement.  Tout  d'abord, 
le  bulletin  individuel  a  été  manipulé  par  un  grand  nombre 
de  personnes,  a  séjourné  dans  des  locaux  plus  ou  moins 
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salubres  et  arrive  finalement  au  bureau  central  dans  un  état 
de  propreté  qui  laisse  beaucoup  à  désirer.  Il  est  encombrant 
et  l'on  doit  disposer  de  vastes  locaux  pour  en  classer  les 
paquets,  qui  se  remplissent  rapidement  de  poussière.  Rien 
ne  distingue  les  bulletins  d'après  le  sujet  dont  ils  émanent; 
ni  le  sexe,  ni  l'état  civil,  ni  la  profession,  ni  la  situation 
géographique,  ni  aucune  donnée  quelconque  ne  s'y  mar- 
quent par  un  signe  apparent.  Il  faut  toujours,  pour  les 
découvrir,  recourir  à  la  lecture,  ce  qui  rend  les  classements 
longs  et  pénibles.  Ajoutons  que  la  mauvaise  écriture  de  ces 
bulletins  est  un  obstacle  à  leur  utilisation  rapide  et  sûre. 
Aussi,  n'est-il  pas  douteux  que  la  fiche,  spécialement  pré- 
parée en  vue  du  dépouillement,  est  supérieure  au  bulletin 
individuel  employé  comme  fiche. 

164.  Avant  de  faire  le  schéma  de  la  fiche,  il  faut  avoir 
arrêté  les  tableaux  de  présentation.  On  reporte  alors  sur  les 
fiches  les  indications  relatives  à  chaque  unité  contenues 
dans  les  bulletins  ou  formulaires. 

Nous  reproduisons  en  premier  lieu  le  modèle  de  la  fiche 
employée  lors  du  «  recensement  général  des  industries  et 
métiers  en  Belgique  »,  en  1896.  Le  type  de  fiche  suivant, 
utilisé  pour  la  statistique  des  accidents'  du  travail  ayant 
entraîné  une  incapacité  de  travail  permanente,  combine  les 
indications  écrites  avec  la  notation  conventionnelle. 

Dans  la  fiche  employée  lors  du  recensement  général  des 
industries  et  des  métiers  en  1896,  les  indications  en  abrégé 
servent  à  désigner  les  industries  les  plus  fréquentes  ;  celles 
qui  se  rencontrent  plus  rarement  sont  indiquées  au  moyen 
du  numéro  de  marquage  porté  à  la  liste  générale.  Les  anno- 
tations typographiques  reproduites  en  marge  de  la  fiche 
permettront  au  lecteur  de  se  rendre  compte  de  l'utilisation 
de  celle-ci;  ainsi,  par  exemple,  aucun  arrondissement  ad- 
ministratif ne  comprend  plus  de  199  communes;  la  com- 
mune 125  (classement  alphabétique)  est  indiquée  par  la  per- 
foration des  chiffres  1  à  la  colonne  des  centaines,  2  à  celle 
des  dizaines,  5  à  celle  des  unités. 
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165.  Les  avantages  que  présente  l'emploi  des  fiches  sont 
nombreux  ;  on  pourrait  croire  que  le  temps  employé  à  leur 
confection  pourrait  être  mieux  mis  à  profit;  cependant, 
l'expérience  a  prouvé  que  cette  méthode  est  à  la  fois  plus 
expéditive,  plus  économique  et  plus  sûre  que  toute  autre  : 

1°  Comme  nous  l'avons  fait  déjà  remarquer,  la  méthode 
des  fiches  est  la  seule  qui  convienne  dans  le  cas  où  les  don- 
nées statistiques  doivent  être  extraites  de  registres,  comme 
les  registres-  de  l'état  civil,  par  exemple; 

2°  Le  principal  avantage  des  fiches  à  l'égard  du  bulletin 
individuel  consiste  dans  leur  pouvoir  représentatif,  qui  est 
fort  étendu.  En  utilisant  des  couleurs,  des  formats  et  des 
profils  différents,  on  différencie  facilement  un  grand 
nombre  de  données;  de  cette  façon,  on  supprime  des  lec- 
tures fatigantes  et  on  abrège  beaucoup  la  durée  des  clas- 
sements ; 

3°  Un  grand  nombre  de  données  se  trouvant  réunies  sous 
un  faible  volume  grâce  aux  indications  conventionnelles 
portées  sur  les  fiches,  il  est  permis  de  classer  le  matériel 
dans  des  meubles  spéciaux.  Les  fiches  étant  réunies  par  des 
tringles,  on  évite  d'en  égarer,  ce  qui  arrive  fréquemment 
pour  les  bulletins  individuels  au  cours  des  nombreux  clas- 
sements qui  se  font  au  cours  des  opérations.  De  plus,  le 
maniement  des  fiches  n'est  pas  antihygiénique  ; 

4"  Les  fiches  peuvent  être  perforées  à  l'endroit  corres- 
pondant où  telle  qualité  de  l'unité  se  trouve  indiquée.  En 
les  groupant  d'après  tel  ou  tel  caractère,  il  est  facile  de 
s'assurer  qu'aucune  fiche  étrangère  à  ce  classement  n'a  été, 
par  erreur,  glissée  dans  ce  paquet  ; 

5°  Les  modifications  de  classe  et  les  combinaisons  entre 
plusieurs  données  sont  rendues  beaucoup  plus  faciles  ; 

6°  Après  le  classement  des  fiches,  les  résultats  numé- 
riques peuvent  être  obtenus  rapidement  à  l'aide  des  ma- 
chines à  calculer,  sans  transcription  nouvelle  des  données. 
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CHAPITRE  III 

Le  dépouillement  statistique  et  le  calcul  par  les  machines 

I.  —  Machines  à  dépouiller. 

166.  Comme  il  était  naturel,  l'homme  s'est  appliqué,  de- 
puis longtemps,  à  trouver  des  dispositifs  capables  d'atté- 
nuer ou  de  supprimer  le  travail  fatigant  du  calcul.  Le 
lecteur  curieux  de  détails  trouvera,  sur  cette  partie  intéres- 
sante des  sciences  appliquées,  dans  les  ouvrages  spéciaux 
la  description  complète  de  ces  appareils  (1). 

L'aperçu  le  plus  sommaire  que  nous  en  donnerions  ici 
nous  éloignerait  de  notre  matière  :  nous  n'avons  qu'à  dire, 
en  peu  de  mots,  en  quoi  consistent  les  principaux  appareils 
à  dépouiller  et  à  calculer  qui  sont  en  usage  dans  les  bureaux 
de  statistique  et  à  en  montrer  les  avantages. 

Le  machinisme  spécial  de  la  statistique  comprend  deux 
catégories  d'appareils  :  ceux  à  calculer  et  ceux  à  dépouiller. 
Nous  parlerons  d'abord  des  seconds  et,  parmi  eux,  nous 
choisirons  les  deux  dispositifs  les  plus  typiques  et  les  plus 
usuels  :  la  machine  électrique  à  dépouiller  du  Dr  Hermann 
Hollerith  et  le  classi-compteur-imprimeur  de  M.  Lucien 
March  (2).  Toutefois,  avant  d'en  aborder  la  description, 
nous  avons  encore  à  indiquer  quelques-  considérations 
générales. 

M.  Hollerith  a  fait  connaître  lui-même  à  la  Société  de 


(1)  Cfr.  Maurice  d'Ocagne  :  Le  calcul  simplifié  par  les  appareils  mécaniques 
et  graphiques,  Paris,  1905.  —  L.  Jacob  :  Le  calcul  mécanique  ;  appareils 
arithmétiques  et  algébriques  intégrateurs,  Paris,  1911.  —  Maurice  d'Ocagne  : 
Calcul  graphique  et  Homographie,  Paris,  1914. 

(2)  Dans  la  division  de  la  matière,  nous  n'avons  pas  suivi  l'ordre  adopté 
par  certains  auteurs,  par  exemple  von  Mayr,  qui  distingue  deux  classes 
parmi  les  appareils  selon  qu'ils  sont  actionnés  mécaniquement  ou  à  la  main. 
Ce  principe  de  distinction  n'a  rien  d'essentiel  et,  en  fait,  les  appareils  à  la 
main  se  transforment  très  souvent  en  appareils  mécaniques. 
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statistique  de  Londres,  en  1894,  comment,  ayant  pris  part 
en  qualité  d'agent  spécial  au  recensement  des  Etats-Unis 
en  1880,  son  attention  fut  attirée  sur  la  nécessité  de  trouver 
quelque  dispositif  mécanique  permettant  de  simplifier  le 
travail  de  dépouillement  et  surtout  de  l'intensifier.  Les 
classements  successifs  auxquels  il  faut  procéder  pour  pou- 
voir dépouiller  les  bulletins  sous  différents  aspects  pren- 
nent un  temps  énorme  dans  les  procédés  ordinaires  de 
dépouillement,  particulièrement  quand  il  s'agit  de  bulletins 
de  ménage;  bien  qu'il  y  ait  progrès  sous  ce  rapport  quand 
on  a  recours  au  bulletin  individuel,  le  travail  de  classement 
n'en  demeure  pas  moins  une  gêne;  reprenant  les»  liasses  de 
bulletins,  les  agents  du  relevé  doivent  feuilleter  rapidement 
des  centaines  de  milliers  de  documents  pour  en  retirer  un 
certain  nombre  ou  opérer  un  classement.  L'état  de  mal- 
propreté de  ces  bulletins  rend  le  travail  aussi  peu  agréable 
que  possible  et  la  variété  de&  écritures,  généralement  mau- 
vaises, amène  bientôt  une  réelle  fatigue  visuelle.  Or,  ces 
classements  successifs  sont  indispensables  dans  les  travaux 
de  statistique.  C'est  par  la  multiplicité  de  ses  travaux  que 
la  statistique  peut  arriver  à  dégager  les  caractères  essen- 
tiels des  phénomènes  collectifs  complexes.  Dans  les  pro- 
cédés anciens,  le  statisticien  doit  souvent  sacrifier  l'une 
ou  l'autre  combinaison^de  données  parce  qu'elle  exigerait 
trop  de  travail  et  trop  de  temps.  Au  fond,  la  question 
du  machinisme  n'est  pas  seulement  une  question  d'ordre 
technique  ou  pratique  :  c'est  une  question  scientifique  h 
laquelle  est  liée,  dans  certains  cas,  la  réalisation  du  but 
supérieur  de  la  statistique. 

167.  La  machine  électrique  de  M.  Hollerith  permet  la 
solution  des  trois  problèmes  statistiques  s-uivants  : 
1°  dépouiller  et  additionner  chaque  classe  séparément; 
2°  séparer  les  fiches  selon  telle  ou  telle  catégorie  ou  selon 
des  points  de  vue  donnés  ;  3°  additionner  les  résultats  des 
combinaisons  de  diverses  catégories. 
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Le  dispositif  Hollerith  comporte  trois  parties  distinctes 
qui  correspondent  à  autant  d'opérations  différentes  :  l'ap- 
pareil à  perforer;  la  machine  à  classer;  le  mécanisme  per- 
mettant de  lire,  de  combiner  et  d'additionner  les  fiches. 
Nous  en  donnerons  une  description  sommaire,  l'essentiel 
n'étant  pas  tant,  au  point  de  vue  auquel  se  place  cet 
ouvrage,  la  précision  technique  que  les  résultats  réalisés  à 
l'aide  de  ce  mécanisme. 

L'utilisation  de  la  machine  suppose  tout  d'abord  que  l'on 
a  confectionné  autant  de  fiches  qu'il  y  a  de  bulletins  indi- 
viduels ou  de  données  individuelles  sur  les  bulletins  de 
ménage.  La  fiche  dont  on  se  sert  est  en  carton;  elle  porte 
des  indications  conventionnelles  correspondant  aux  diver- 
ses qualités  et  nombres  que  peuvent  présenter  les  unités  à 
dépouiller.  Généralement,  ces  indications  sont  réalisées 
par  des  combinaisons  de  chiffres  :  par  exemple,  les  pro- 
vinces, arrondissements,  communes  d'un  pays,  sont  dési- 
gnés au  moyen  d 'un  numéro  d 'ordre  ;  ce  numéro  se  marque 
sur  la  fiche  en  réservant,  à  chacune  de  ces  divisions  admi- 
nistratives, autant  de  rangées  verticales  de  neuf  chiffres 
que  le  numéro  d'ordre  comporte  de  rangées  et  en  pointant, 
dans  chaque  colonne,  successivement  le  chiffre  qui  corres- 
pond aux  unités,  dizaines,  centaines.  Pour  d'autres  don- 
nées, on  se  sert  simplement  des  initiales  du  mot  qui  les 
désigne,  comme  :  C  =  célibataire,  M  =  marié,  V  =  veuf, 
D  -  divorcé,  S  =  séparé  de  corps.  Grâce  à  ces  com- 
binaisons, on  arrive  aisément  à  porter  sur  une  fiche  de 
dimensions  restreintes  (0,15  X  0,08)  un  très  grand  nombre 
de  données.  Voici,  par  exemple,  le  modèle  de  la  fiche 
employée  pour  le  recensement  de  l'agriculture  aux 
Etats-Unis,  en  1900.  Les  indications  imprimées  «  en 
clair  »  ont  été  ajoutées  pour  la  facilité  du  lecteur  : 
elles  ne  figurent  pas  sur  le  modèle  original.  En 
peu  de  temps,  les  employés  sont  familiarisés  avec  les  signes 
conventionnels  et  avec  la  place  qu'ils  occupent  sur  la  carte. 
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168.  La  carte  perforée  peut  être  assimilée,  comme  l'a  dit 
M.  Cheysson,  au  carton  du  métier  Jacquard,  mais  au  lieu 
de  fils  réglant  les  mouvements  des  navettes,  la  carte  laisse 
passer  un  courant  électrique.  La  première  besogne  consiste 
donc  à  transformer  les  bulletins  individuels  en  cartes  per- 
forées. Cette  partie  du  travail  présente  une  grande  impor- 
tance. Elle  s'exécute  à  l'aide  de  machines  à  perforer  dont  il 
existe  plusieurs  types.  Le  plus  ancien  porte  le  nom  de 
Keyboard-Punch  ;  en  plaçant  une  pointe  indicatrice  sur  une 
feuille  métallique  reproduisant  les  indications  de  la  fiche, 


F [G.  1. 


l'opérateur,  au  moyen  d'un  dispositif  analogue  à  celui  du 
pantographe,  perfore  la  fiche  elle-même  à  l'endroit  corres- 
pondant. Le  Keyboard-Punch  est  assez  lent,  attendu  qu'il 
ne  peut  perforer  qu'une  seule  fiche  à  la  fois.  M.  Hollerith, 
lors  de  la  IXe  session  de  l'Institut  international  de  statis- 
tique, en  1895,  annonçait  déjà  que  ce  premier  appareil  serait 
remplacé  par  un  autre  plus  rapide.  Le  perfectionnement 
annoncé  a  été  réalisé  au  moyen  d'un  appareil  (Key-Punch) 
dont  l'aspect  général  est  indiqué  au  moyen  de  la  figure  1 
ci-dessus. 

Le  Key-Punch  est  un  appareil  plus  simple  que  le  pre- 
mier. Il  consiste  en  une  solide  boîte  métallique  pourvue  de 
onze  poinçons  dont  dix  numérotés  de  0  à  9,  plus  un  poinçon 
désigné  par  la  lettre  x.  La  carte  placée  sur  une  plaque  mobile 
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est  insérée  par  l 'opérateur  dans  l 'appareil  jusqu'à  ce  que  les- 
quatre  premières  colonnes  imprimées  à  partir  du  côté 
gauche  soient  placées  sous  les  poinçons;  on  suf)pose  que 
toutes  les  notations  conventionnelles  de  la  fiche  sont  ex- 
primées par  des  chiffres,  comme  sur  le  modèle  de  la  fiche 
employée  pour  le  recensement  agricole.  La  lettre  x  est  im- 
primée dans  les  cases  de  la  fiche  correspondant  à  la  donnée 
((  néant  »  du  bulletin.  Elle  sert  à  indiquer  qu'il  n'y  a  aucune 
donnée  à  dépouiller  relativement  à  ce  point  et,  en  attirant 
forcément  l'attention  de  l'employé  sur  chaque  case  de  la 
fiche,  elle  évite  des  erreurs  tout  en  facilitant  le  contrôle. 

A  part  les  cases  où  figure  la  lettre  x,  on  doit  faire  une 
perforation  à  chaque  colonne  verticale  de  la  fiche  :  une 
ferme  de  12  acres  sera  indiquée  en  poinçonnant  aux  endroits 
0,  1,  2  de  la  case  réservée  à  l'étendue  cultivée. 

Le  Key-Punch  se  construit  actuellement  d'après  un 
modèle  actionné  par  l'énergie  électrique;  le  rendement  de 
cette  machine  à  perforer  est  très  considérable.  En  général, 
ce  travail  est  confié  à  du  personnel  féminin. 

169.  Le  Gang-Punch  est  une  machine  plus  robuste, 
capable  de  perforer  plusieurs  cartes  à  la  fois.  Certaines 
indications  se  répétant  plusieurs  milliers  de  fois  —  comme 
le  nom  des  provinces  et  des  villes  —  on  peut  augmenter  le 
rendement  de  la  machine  en  lui  faisant  perforer  une  dizaine 
de  fiches  à  la  fois.  Beaucoup  de  données  se  répètent  même 
dans  les  bulletins  faisant  partie  des  dépouillements  les  plus 
compliqués. 

Dans  un  recensement  industriel,  par  exemple,  on  trouve 
des  milliers  de  bulletins  se  rapportant  à  des  personnes  du 
sexe  masculin  exerçant  un  même  métier,  exploitant  une 
entreprise  individuelle,  n'employant  que  des  membres  de 
leur  famille.  Des  bulletins  de  l'espèce  peuvent  être  aisément 
traduits  en  fiches  par  séries,  à  l'aide  du  Gang-Punch,  dont 
on  verra  à  la  page  suivante  une  reproduction  (fig.  2). 

Les  résultats  atteints  au  moyen  des  machines  à  perforer 
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seront  indiqués  et  critiqués  au  moment  où  nous  entrepren- 
drons l'étude  du  rendement  et  des  avantages  du  machi- 
nisme statistique.  En  attendant,  nous  continuons  la  des- 
cription de  l'appareil  en  nous  efforçant  de  la  rendre  aussi 
intelligible  que  possible. 


Fig.  2. 


170.  Une  des  difficultés  les  plus  ardues  du  dépouillement 
consiste  dans  le  classement  des  bulletins  d'après  les  points 
de  vue  nombreux  que  requiert  la  présentation  en  tableaux. 
De  toute  façon,  il  faut  employer  des  fiches;  le  classement 
des  bulletins  individuels,  qui  peuvent  être  assimilés  à  des 
fiches,  reste  fort  lent  et  pénible.  M.  Hollerith  s'est  donc 
demandé  s'il  n'existait  pas  quelque  moyen  de  classer  auto- 
matiquement les  fiches  statistiques  perforées  et  il  y  est 
arrivé  par  l'ingénieux  appareil  dont  la  figure  3  (p.  270) 
représente  l'aspect  d'ensemble.  M.  le  Dr  Jacques  Bertillon 
en  a  donné  une  description  très  claire  (1)  que  nous  utili- 
sons dans  le  résumé  qui  suit. 


(1)  Dans  La  Natwe  du  17  janvier  1914. 
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Sur  le  plateau  supérieur  de  la  machine  (Illimité  par  le 

bâti  en  fonte,  se  placenl  les  caries  perforées,  mises  ver- 
ticalement dans  le  sens  «le  L'impression.  Les  fiches  sont 
réunies  par  paquets  et  sont  serrées  au  moyen  d'une  barre 
entraînée  par  des  poids,  de  sorte  que  Le  paquet  est  tou- 
jours oompact.  lia  première  carie  se  trouve  au-dessus 
d'une  fente  où  elle  s 'engage  et  elle  y  est-  poussée  par  un 
cadre  mobile  (partie  supérieure  du  bâti)  qui  moule  et  des 
cend  alternativement  et  appuyé  sur  la  première  fiche  qui 
se  présente  en  dessous  de  lui. 

La  carte  se  trouvant  poussée  sous  La  plate  forme  s'en- 
gage entre  des  rouleaux  qu'on  aperçoit,  sur  la  figure  3\ 
celui  d'arrière  est  en  ébonito,  celui  d'avant  est  en  cuivre; 
ce  dernier  est  chargé  d'électricité  par  une  languette  : 
la  source  d'électricité  est  le  petit  moteur  placé  au  pied  de 

l 'appareil. 

S'appuvant  sur  le  rouleau  eu  êbonite,  une  forte  aiguille 
métallique  vient  reposer  son  extrémité,  munie  d'une  pointe 
verticale,  sur  le  rouleau  en  cuivre,  ou  plutôt  sur  La  carte 
qui  s'engage  entre  les  rouleaux.  L'aiguille  est  mobile  dans 

le  sens  du  rouleau,  de  sorte  qu'on  peut  faire  promener  son 
extrémité  sur  celle  des  colonnes  de  la  fiche  qui  correspond 
à  l'unité  d'après  laquelle  les  cartes  doivent  être  classées. 
S'agit-il,  par  exemple,  de  classer  les  exploitations  agri- 
coles de  100  acres  et  plus  (-100,  100-200,  200-300,  etc.), 
l'aiguille  sera  placée  en  regard  de  La  quatrième  ligne  ver- 
ticale de  la  fiche  reproduite  page  2(55.  Aussi  Longtemps 
que  L'aiguille  se  promènera  sur  une  surface  pleine,  il  ne 
se  passe  rien,  mais  quand  l'aiguille  rencontre  un  trou  per- 
foré dans  la  carte,  son  oxîiémité  entre  en  contact-  avec  le 
rouleau  chargé  d'électricité  et  aussitôt  la  carte  sera  en- 
traînée vers  un  des  godets  classeurs,  placés  sous  la  plate- 
forme, au  nombre  de  onze  :  un  pour  les  zéros,  i)  pour  I  à  !>, 
un  pour  les  erreurs. 

La  description  du  mécanisme  servant  à  diriger  La  carte 
Vers  le  godet  qui  Lui  est  réservé  et  non  vers  un  autre  est 
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d'essence  trop  technique  pour  pouvoir  être  abordée  ici.  On 
en  trouvera  une  dans  l'article  déjà  cité  de  M.  le  DrBertillon. 


Fig.  3. 


171.  Il  ne  suffit  pas  de  classer  les  fiches,  il  faut  surtout 
les  dépouiller,  enregistrer  les  unités  qui  y  sont  marquées 
à  l'aide  de  perforations  et  ajouter  les  unes  aux  autres 
celles  qui  sont  de  même  nature.  C'est  ce  que  réalise  la 


LE  CALCUL  PAIt  LES  MACHINES 


271 


troisième  et  la  plus  importante  partie  de  la  machine,  com- 
posée de  trois  parties  essentielles  :  a)  l'appareil  de 
contact;  b)  un  jeu  de  compteurs  électriques;  c)  le  système 
des  relais. 

L'appareil  de  contact  est  peut-être  la  partie  la  plus 
neuve  du  système  imaginé  par  M.  Hollerith.  Il  comprend 
un  plateau  fixe  posé  sur  la  table,  horizontalement,  et  un 
plateau  mobile  se  rabattant  sur  le  premier  à  l'aide  d'un 
levier  manœuvré  à  la  main  par  une  poignée.  Le  plateau 
mobile  contient  dans  son  épaisseur  une  série  d'aiguilles 
métalliques  symétriquement  disposées,  attachées  à  un  res- 
sort en  boudin  suffisamment  distendu  pour  que  les  extré- 
mités des  aiguilles  sortent  quelque  peu  de  la  boîte  où  elles 
sont  renfermées.  Le  plateau  fixe  présente  d'abord  une 
plaque  métallique,  de  la  grandeur  de  la  fiche  à  employer, 
percée  d'autant  de  trous  qu'il  y  a  d'endroits  à  perforer 
indiqués  sur  la  fiche  ;  ces  trous,  les  aiguilles  et  la  fiche  cor- 
respondent exactement.  Quand  on  met  une  fiche  perforée 
sur  le  plateau  fixe,  les  trous  de  la  fiche  correspondent  aux 
trous  de  la  plaque  métallique  et  au-dessous  on  voit  se  mon- 
trer autant  de  petits  godets  remplis  de  mercure  (1)  {fig.  4). 
Qu'on  abaisse,  sur  la  fiche  perforée,  le  plateau  mobile,  les 
aiguilles  rencontreront  le  papier  en  certains  endroits  et 
se  replieront  à  l'intérieur,  grâce  au  ressort  à  boudin  au- 
quel elles  sont  attachées;  les  autres  ne  rencontrant  aucun 
obstacle  plongeront,  à  travers  les  trous  perforés,  dans  les 
godets  de  mercure;  un  courant  opposé  étant  rattaché 
à  chaque  plateau,  le  circuit  se  trouve  fermé  par  l'introduc- 
tion des  aiguilles  dans  les  godets,  mais  seulement  pour  les 
données  correspondant  à  ces  récipients  de  mercure. 

Dans  la  machine  employée  au  dépouillement  du  recen- 
sement agricole,  il  n'y  avait  pas  moins  de  354  aiguilles,  et, 
par  conséquent,  autant  d'ouvertures  dans  la  plaque  métal- 


(1)  Voyez  page  272  (fig.  .'/) f  une  reproduction  de  la  machine  complète; 
l'appareil  de  contact  est  placé  sur  la  table,  à  droite. 


Fig.  5 
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lique  et  de  godets.  A  chaque  godet  correspond  un  compteur 
électrique,  composé  de  quatre  chiffres  et  qui  avance  d'une 
unité  à  chaque  contact.  Après  un  certain  temps,  on  relève 
les  chiffres  indiqués  par  les  compteurs  et  on  remet  ceux-ci 
à  zéro.  Dans  le  plan  primitif,  le  travail  des  compteurs  était 
rendu  apparent  au  moyen  de  cadrans  pourvus  d'une 
aiguille  mobile  {fig.  5).  Actuellement,  la  disposition  est 


Fis.  6. 


différente;  les  chiffres  apparaissent  directement  dans 
les  lucarnes  et  les  fiches  sont  entraînées  automatiquement 
vers  des  boîtes  réservées  chacune  au  comptage  d'un  fait 
particulier  {fig.  6).  Le  comptage  effectué  de  la  sorte  ré- 
pond à  toutes  les  nécessités  des  tableaux  primaires  dans  les- 
quels les  unités  sont  comptées  séparément:  tant  d'hommes, 
de  femmes,  de  patrons,  d'employés,  d'ouvriers.  La  machine 
réalise  ainsi  les  desiderata  ordinaires  de  la  statistique, 
mais  lorsqu'on  analyse  les  résultats  d'un  relevé,  on  a  sou- 
vent besoin  de  réunir  des  données  plus  compliquées.  Ainsi, 
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veut-on  présenter  séparément  les  données-  relatives  aux 
établissements  industriels  qui  employent  des  ouvriers 
étrangers  à  la  famille  des  exploitants  et  utilisent  une  force 
motrice,  ou  si  l'on  désire  savoir  combien  d'enfants  sont 
nés  après  dix  ans,  du  mariage  d'un  père  de  tel  âge  et  d'une 
mère  de  tel  autre,  on  se  trouve  en  présence  de  combi- 
naisons qui  ne  peuvent  se  réaliser  qu'à  l'aide  de  classe- 
ments répétés,  longs  et  fastidieux.  En  dehors  du  système 
des  fiches,  de  telles  combinaisons  de  données  sont  même 
radicalement  impossibles;  elles  ne  sont  guère  plus  réali- 
sables pratiquement  lorsqu'on  dispose  de  bulletins  indi- 
viduels. Seule,  la  fiche  perforée,  dont  on  peut  vérifier  le 
classement  à  l'aide  d'une  tige  métallique  traversant,  sans 
rencontrer  d'obstacle,  tous  les  trous  correspondant  à  ces 
indications,  est  capable  d'assurer  le  dépouillement  de 
semblables  données. 

La  machine  Hollerith  assure  très  facilement  la  solution 
de  ce  problème  à  l'aide  des  «  relais  »  ou  connexions  élec- 
triques dont  elle  est  pourvue.  Au  début,  ces  combinaisons 
ne  pouvaient  se  faire  qu'à  la  condition  d'un  assez  long 
travail  de  préparation,  et  chaque  problème  statistique  se 
doublait  d'un  problème  électrique  exigeant  la  coopération 
d'un  technicien.  Mais,  dès  1895  déjà,  d'importants  perfec- 
tionnements ont  été  apportés  à  l'appareil  ;  l'adjonction  d'un 
commutateur  général  a  eu  pour  effet,  d'après  M.  Rauch- 
berg,  «  de  faciliter  par  avance  toutes  les  combinaisons 
possibles  des  diverses  parties  essentielles  de  la  machine, 
en  les  mettant  les  unes  avec  les  autres  dans  une  relation 
telle  qu'une  seule  cheville  ou  deux  chevilles  reliées  par  un 
fil  conducteur  suffisent  pour  ramener  les  rattachements 
et  les  transmissions  de  courant  désirables  ».  On  trouvera, 
dans  le  rapport  que  M.  Rauchberg  adressa  en  1895  à  l'In- 
stitut international  de  statistique  (1),  un  aperçu  général 


(1)  Bulletin  de  l'Institut  international  de  statistique,  t.  IX,  première 
livraison,  p.  249.  Rome,  1895. 
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du  fonctionnement  du  commutateur  général;  ces  détails 
nous  semblent  en  dehors  du  cadre  d'une  description  non 
technique,  telle  que  la  nôtre,  et  nous  nous  bornons  à  ren- 
voyer le  lecteur  aux  mémoires  techniques  relatifs  au  fonc- 
tionnement de  la  machine.  Nous  devons  noter  toutefois  un 
perfectionnement  important  apporté  à  la  machine  Hollerith 
par  le  service  du  Cénsus.  Ce  service,  qui  construit  lui-même 
les  appareils  dont  il  se  sert,  a  imaginé  un  dispositif  per- 
mettant d'imprimer  directement  les  données  au  compteur, 
au  lieu  de  les  copier;  la  compagnie  qui  exploite  les  brevets 
Hollerith  annonce  qu'elle  appliquera  prochainement  à  ses 
machines  un  appareil  de  l'espèce. 

172.  Le  principe  de  marquage,  de  classification  et  de 
fabulation  des  machines  Hollerith  a  été  lui-même  l'objet  de 
plusieurs  perfectionnements  dans  le  pays  où  il  a  été 
trouvé  et  appliqué  pour  la  première  fois  :  les  Etats- 
Unis  d'Amérique.  Ainsi,  les  machines  Hollerith,  jus- 
qu'à présent  du  moins,  n'enregistrent  pas  elles-mêmes  les 
données  sélectionnées  qu'elles  ont  pour  objet  de  compter; 
c'est  à  un  opérateur  travaillant  à  la  main,  qu'incombe  ce 
soin,  et  pour  ce  faire  l'opérateur  est  tenu  d'arrêter  la  ma- 
chine, puis  de  la  remettre  en  marche.  Les  machines  «  Po- 
wers  »  ont  réalisé  un  perfectionnement  important  sous  le 
rapport  de  la  sélection  des  cartes  et  surtout  sous  celui  de  la 
transcription  des  données  qui  se  fait  automatiquement; 
après  avoir  été  sélectionnées,  les  cartes  sont  portées  à  la 
machine  tabulatrice  qui  enregistre  en  clair  et  sous  forme 
de  tableaux  les  renseignements  et  totalise  automatique- 
ment les  chiffres  des  colonnes;  cependant  l'opération  exige 
encore  le  transport  à  la  main  des  fiches  sélectionnées  jus- 
qu'il la  machine  à  tabuler.  De  nouveaux  appareils,  les  ma- 
chines ((  Pierce  »,  que  nous  avons  vues  fonctionner  en 
Amérique,  présentent  de  précieux  avantages.  Ainsi,  les 
fiches  peuvent  contenir  indifféremment  des  lettres  et  des 
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chiffres,  ce  qui  augmente  beaucoup  le  pouvoir  de  repré- 
sentation des  cartes;  la  perforation  se  fait  à  l'aide  d'une 
machine,  pourvue  d'un  clavier  semblable  à  celui  d'une  ma- 
chine à  écrire;  le  fonctionnement  de  l'appareil  perforateur 
est  à  la  fois  rapide,  sûr  et  assez  doux  pour  être  confié  à  un 
personnel  féminin.  La  sélection  des  cartes  se  fait  par  des 
machines  à  classer  opérant  dans  le  sens  horizontal,  au  lieu 
du  sens  vertical  comme  dans  les  machines  Hollerith;  ces 
appareils  conduisent  automatiquement  les  cartes  sélection- 
nées jusqu'à  l'appareil  tabulateur.  Celui-ci  reproduit  en 
clair  tous  les  renseignements,  sous  forme  de  tableaux  et  en 
fait  l'addition  par  colonnes  de  chiffres.  Cet  ensemble  de 
dispositifs  représente  une  somme  importante  de  perfec- 
tionnements sous  le  rapport  de  la  rapidité  et  de  l'épargne 
de  main-d'œuvre. 

173.  Le  classi-compteur-imprimeur  de  M.  Lucien  March 
est  un  appareil  tout  à  fait  différent  de  la  machine  élec- 
trique de  M.  Hollerith.  Beaucoup  plus  simple,  il  n'en  rend 
pas  moins  de  grands  services  dans  le  travail  de  dépouil- 
lement et  paraît  même  mieux  adapté  à  la  besogne  jour- 
nalière d'un  bureau  de  statistique.  Le  principe  et  le  fonc- 
tionnement du  classi-compteur-imprimeur  ont  été  exposés 
par  M.  Georges  Vitoux,  dans  un  article  paru  dans  La 
Nature  (11  mai  1901,  p.  369)  auquel  nous  nous  référons. 

Le  problème  dont  M.  March  a  cherché  la  solution,  est 
triple  :  enregistrer  simultanément  les  divers  aspects  sous 
lesquels  une  unité  statistique  est  envisagée  dans  les  cadres 
(sexe,  état  civil,  âge,  profession,  lieu  de  naissance  d'un 
individu)  ;  supprimer  le  travail  du  relevé  des  compteurs, 
ou  plutôt  permettre  l'enregistrement  simultané  et  rapide 
des  indications  qu'ils  portent;  en  même  temps,  trouver 
un  dispositif  de  contrôle  d'après  lequel  l'exactitude  du 
travail  effectué  par  l'employé  pourrait  être  appréciée. 

L'appareil  n'est  pas  très  volumineux:  deux  fois  les  di- 
mensions d'une  machine  à  écrire.  Le  modèle  que  nous  avons 
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sous  les  yeux  (fig.  7)  et  qui  est  utilisé  dans  no&  bureaux  est 
assez  lourd;  il  est  probable  que  depuis  l'époque  déjà  éloi- 
gnée; de  son  acquisition,  les  appareils  nouveaux  ont  dû 
perdre  quelque  chose  de  cette  apparence  massive. 

La  partie  antérieure  est  une  tablette  légèrement  inclinée 
comme  celle  d'une  machine  à  additionner,  comprenant  une 
soixantaine  de  touches  formant  un  clavier.  Ces  touches  ne 
portent  aucune  désignation,  il  appartient  au  statisticien 
•  le  décider,  lors  de  la  mise  en  train,  à  quelle  donnée  corres- 


Fig.  7. 


pondra  telle  touche  de  l'appareil.  A  cet  effet,  une  petite 
ouverture  ménagée  sous  un  bouton  en  matière  transpa- 
rente permet  de  glisser  une  inscription  manuscrite,  chiffre 
ou  lettre  conventionnelle  ou  «  en  clair  ».  Nous  avons  vu 
remplacer  ce  système  par  des  inscriptions  portées  direc- 
tement sur  la  tablette  à  côté  ou  en  dessous  des  touches  ;  les 
opérateurs  nous  ont  aussi  fait  remarquer  que  le  toucher 
serait  plus  agréable  à  l'aide  de  touches  en  ébonite,  légère- 
ment creusées  pour  recevoir  l'extrémité  du  doigt. 
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Chaque  touche  correspond  à  un  compteur  formé  de  quatre 
chiffres.  Lorsqu'on  abaisse  une  touche,  celle-ci  vient  ap- 
puyer sur  un  levier  qui  oblige,  par  l'intermédiaire  d'une 
tige  de  commande  dont  elle  dépend,  le  compteur  auquel  elle 
se  relie  à  avancer  d'une  division.  L'opérateur  abaisse  suc- 
cessivement toutes  les  touches  qui  correspondent  aux 
diverses  indications  de  la  fiche  à  dépouiller,  puis,  en  abais- 
sant la  manette  placée  à  droite  de  la  machine,  il  fait 
avancer  d'un  rang  tous  les  compteurs  intéressés.  Il  continue 
de  la  sorte  jusqu'à  la  fin  de  la  série  à  dépouiller. 

Les  chiffres  marqués  par  les  compteurs  apparaissent,  à 
l'arrière  de  la  machine,  par  une  lucarne  ménagée  dans  la 
plaque  de  cuivre  qui  recouvre  l'appareil.  Lorsqu'on  veut 
totaliser,  on  étend  sur  les  compteurs  un  ruban  chargé 
d'encre  grasse  et  on  rabat  le  cadre  mobile  situé  à  l'arrière. 
Ce  cadre  est  formé  de  six  rouleaux,  correspondant  aux 
rangées  de  compteurs;  sur  ces  rouleaux  s'enroule  une 
feuille  de  papier.  Il  suffit  d'une  légère  pression  pour  im- 
primer les  caractères  apparents  des  compteurs.  Le  papier 
est  ensuite  enroulé  légèrement  et  l'appareil,  la  partie  mo- 
bile relevée,  est  prêt  pour  recevoir  de  nouvelles  inscrip- 
tions après  qu'on  a  remis  les  compteurs  au  zéro  en  don- 
nant un  tour  de  la  manivelle  située  en  arrière  du  levier. 
L'appareil  de  contrôle  est  placé  dans  le  socle  de  la  machine  : 
il  consiste  en  un  compteur  spécial  qui  enregistre  le  numéro 
de  l'opération  sur  une  bande  de  papier  se  déroulant  auto- 
matiquement. En  regard,  des  perforations,  exécutées  par 
des  aiguilles  actionnées  par  les  touches,  correspondent  à  la 
place  des  compteurs  mis  en  action.  Il  suffit  de  confronter 
ces  indications  aux  mentions  du  bulletin  pour  s'assurer  si 
celui-ci  a  été  correctement  dépouillé;  bien  entendu,  ce  con- 
trôle ne  se  fait  que  cinq  ou  six  fois  pour  cent  bulletins  dé- 
pouillés, c'est-à-dire  que  l'on  juge  le  dépouillement,  sous  le 
rapport  de  son  exactitude,  par  voie  d'essai. 
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II.  —  Machines  à  calculer  (1). 


174.  Les  machines  à  calculer  sont,  à  la  fois,  beaucoup  plus 
anciennes  et  plus  nombreuses  que  les  machines  à  dépouiller. 
Ces  dernières  sont  nées  le  jour  où  l'étendue  et  la  complica- 
tion du  matériel  statistique  sont  devenues  telles  qu'elles 
dépassaient  les  ressources  en  personnel  et  en  argent  des 
bureaux  de  statistique;  ce  fait  est  de  date  récente,  puisqu'il 
résulte  du  dernier  état  de  développement  des  recherches 
statistiques.  Au  contraire,  le  besoin  d'une  aide  matérielle 
dans  le  pénible  travail  du  calcul  a  toujours  été  vivement  res- 
senti par  les  mathématiciens,  les  astronomes,  etc.,  dont  les 
travaux  sont  bien  antérieurs  à  ceux  des  statisticiens.  Les 
plus  grands  noms  des  mathématiques  se  retrouvent  dans  la 
liste  des  inventeurs  de  machines  à  calculer  :  en  1617,  Neper 
indiquait  dans  sa  Rhabdologie,  publiée  à  Edimbourg,  le 
procédé  connu  sous  le  nom  des  ((  bâtonnets  de  Neper  »,  à 
l'aide  duquel  on  peut  trouver  immédiatement  le  produit 
d'un  facteur  multiplié  par  un  chiffre  ;  en  1642,  Biaise  Pascal 
inventa  la  machine  à  calculer,  véritable  machine  arith- 
métique, la  première  réalisée  dans  ce  genre,  qui  fut  imitée 
et  améliorée  un  grand  nombre  de  fois;  Leibnitz,  l'illustre 
fondateur  du  calcul  différentiel,  imagina  en  1671  et  parvint 
à  réaliser,  en  1694,  sous  une  forme  imparfaite  encore,  une 
machine  à  multiplier  par  additions  successives. 

Les  appareils  à  calculer  usités  dans  les  bureaux  de  statis- 
tique sont  ceux  qui  servent  à  effectuer  les  opérations  élé- 
mentaires de  l'arithmétique.  Nous  en  passerons  en  revue 
quelques  types,  non  sans  avoir  prévenu  le  électeur  qu'il 
existe  d'autres  modèles  que  ceux  décrits  et  que  l'auteur  n'a 
aucunement  intention  de  recommander  une  marque  plu- 


(1)  La  partie  historique  et  scientifique  de  cet  exposé  est  faite  d'après 
l'ouvrage  de  M.  Maurice  d'Ocagne  :  Le  calcul  simplifié  par  les  procédés 
mécaniques  et  graphiques,  Taris,  1005. 


280 


PRINCIPES  DE  STATISTIQUE 


tôt  qu'une  autre,  les  modèles  cités  l'étant  uniquement 
à  titre  exemplatif . 

175.  M.  d'Ocagne  appelle  «  instruments  arithmétiques  )) 
les  appareils  qui  permettent  d'effectuer  manuellement  les 
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Fig.  8. 


opérations  de  l'arithmétique  sans  le  secours  d'aucun  méca- 
nisme :  ressorts,  cames,  engrenages,  etc. 

Au  nombre  de  ces  appareils,  figure  l'arithmographe 
«  Troncet  »,  qui  se  compose  d'une  série  de  colonnes  recour- 
bées en  forme  de  crosse,  comme  dans  le  modèle  ci- 
dessus  (fig.  8).  En  regard  de  chaque  colonne  sont  écrits  les 
chiffres  0  à  9  et  en  face  on  voit  un  creux  ;  si  les  dents  qui 
comprennent  ce  creux  sont  blanches,  on  parcourt  la  fente 
longitudinale,  à  l'aide  d'un  stylet,  de  haut  en  bas,  jusqu'au 
butoir  inférieur;  si  elles  sont  noires  ou  rouges,  on  opère 
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le  mouvement  inverse,  jusqu'à  l'extrémité  recourbée  en 
forme  de  crosse. 

Soit  le  nombre  6.478  à  faire  entrer  dans  une  addition  ;  il 
n'y  a  qu'à  placer  la  pointe  mousse  du  crayon  successive- 
ment à  côté  des  chiffres  (5,  4,  7,  8  pour  que  le  crayon 
lui-même,  par  son  propre  mouvement  sur  les  lames  chif- 
frées, fasse  apparaître  le  total  de  l'addition. 

L 'arithmographe  permet  d'effectuer  les  quatre  opéra- 
tions fondamentales  de  l'arithmétique.  Le  bas-  prix  de 
l'appareil,  dont  le  modèle  le  plus  complet  (opérant  sur  les 
nombres  de  12  chiffres,  pourvu  d'un  effaceur  et  d'un  mul- 
tiplicateur à  8  chiffres)  ne  coûtait  (avant  la  guerre)  que 
40  francs,  est  une  caractéristique  qui  mérite  d'être  signa- 
lée. 

176.  Un  autre  additionneur,  d 'un  type  imité  de  la  machine 
Pascal,  a  été  réalisé  en  1841  par  le  Dr  Roth.  «  Dans  l'addi- 
tionneur Roth,  dit  M.  d'Ocagne,  la  chiff raison,  au  lieu 
d'être  inscrite  sur  la  surface  latérale  d'un  cylindre,  l'est  le 
long  d'un  disque  qu'on  fait  tourner  directement  au  moyen 
d'une  pointe  introduite  entre  les  dents  fixées  à  sa  tranche- 
La  chiffraison  de  sens  contraire  correspondant  à  la  sous- 
traction est  marquée  en  rouge  sur  un  cercle  concentrique 
au  premier,  chacune  de  ces  chiffraisons  paraissant  à  une 
lucarne  distincte  (fig.  9). 

a  Le  perfectionnement  mécanique  réalisé  par  rapport  à  la 
machine  de  Pascal  et  à  toutes  celles  qui  en  sont  dérivées, 
tient  à  ce  que  les  appareils  de  retenue,  d'un  système  d'ail- 
leurs entièrement  nouveau,  sont  disposés  de  façon  à  n'avoir 
jamais  à  fonctionner  simultanément  »  (1). 

La  machine  de  Roth  a  été  imitée  et  perfectionnée.  Dans 
un  appareil  que  nous  avons  sous  les  yeux,  nous  voyons 
qu'on  peut  additionner  de  droite  à  gauche,  ou  de  gauche  à 
droite,  dans  le  sens  de  l'écriture  et  de  l'énonciation  des 


(1)  Cfr.  d'Ocagne,  loc.  cit.,  p.  32. 


282 


PRINCIPES  DE  STATISTIQUE 


nombres  à  la  dictée.  Les  chiffres  de  contrôle  marquent 
toujours  le  dernier  enregistrement;  le  résultat  apparaît  en 
chiffres  rouges  dans  les  lucarnes  supérieures.  Après  chaque 
enregistrement,  on  remet  les  cadrans  à  zéro  en  poussant  sur 
le  déclic,  à  gauche.  L'effaceur  du  résultat  total  agit  très 
rapidement  :  il  suffit  d'introduire  le  stylet  dans  la  fente  et 
de  pousser  quelques  coups  vers  la  gauche  jusqu'à  ce  que  les 
lucarnes  supérieures  ne  laissent  plus  apercevoir  que  des 
zéros.  L'opération  est  un  peu  plus  compliquée  pour  la  sous- 


Fig.  9. 


traction;  elle  doit  se  faire  en  commençant  vers  la  droite 
(unités) . 

177.  Les  machines  à  additionner,  à  touches,  paraissent 
avoir  eu  pour  premier  objectif  de  simplifier  la  notation  des 
nombres.  Elles  ont  été  l'objet  d'une  véritable  exploitation 
industrielle  en  Amérique,  où  de  nombreux  perfectionne- 
ments leur  ont  été  apportés.  Les  machines  à  additionner- 
imprimer  datent  de  1888;  certains  types  sont  bien  connus 
en  France  et  en  Belgique,  où  ils  sont  employés  dans  tous  les 
grands  établissements  financiers.  La  machine  à  addition- 
ner, à  touches,  est  composée  d'un  clavier,  légèrement  in- 
cliné, comprenant  pour  chaque  ordre  décimal  une  colonne 
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de  neuf  touches  numérotées  de  1  à  9,  la  rangée  des  1  occu- 
pant la  place  inférieure,  puis  la  rangée  des  2,  et  ainsi  de 
suite.  Les  machines  diffèrent  d'après  le  nombre  de  rangées  ; 
les  plus  grandes  en  ont  jusqu'à  12  ou  14,  les  plus  usuelles 
en  ont  9  ;  le  clavier  est  alternativement  composé  de  rangées 
verticales  noires  et  blanches,  les  deux  premières  —  noires 


Fig.  10. 


—  (à  droite)  correspondant  aux  centièmes,  puis  les  trois 
suivantes  —  blanches  —  aux  unités,  centaines  et  milliers, 
les  trois  suivantes  —  noire»  —  aux  unités,  dizaines  et  cen- 
taines de  l'ordre  des  mille,  puis  la  dernière  —  blanche  — 
aux  millions.  Nous  reproduisons  ici  un  des  types  les  plus 
connus,  la  machine  «  Burroughs  »,  imprimant  son  travail 
sur  rouleau  ou  sur  feuille  {fig.  10). 

Une  quantité  d'améliorations  successives  ont  été  appor- 
tées aux  machines  à  additionner.  Ainsi,  elles  possèdent 
aujourd'hui  des  touches  permettant  de  corriger,  rangée  par 
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rangée,  les  inscriptions  erronées  et  une  touche  effaçant 
d'un  seul  coup  l'inscription  tout  entière;  elles  sont  aussi 
munies  cl  'un  bouton  qu'il  suffit  de  presser  pour  «  éliminer  » 
un  chiffre  qu'on  veut  imprimer  sans  le  comprendre  dans 
l'addition  et  un  autre  bouton  permettant  de  répéter  un 
facteur  sans  le  «  frapper  »  chaque  fois.  Le  total  apparaît 
dans  des  lucarnes,  sans  qu'il  soit  besoin  de  faire  agir  le 
mécanisme  imprimeur  du  total.  Mais  l'amélioration  la  plus 
heureuse  a  été  celle  qui  consista  à  substituer  la  manœuvre 
électrique  à  la  marche  à  la  main.  Une  réglette,  fixée  à  droite, 
permet  à  l'opérateur,  par  le  plus  léger  attouchement,  d'en- 
registrer et  de  totaliser  les  données.  La  fatigue  est  entière- 
ment supprimée,  grâce  à  l'électricité,  qui  est  fournie  par  un 
petit  moteur  fixé  sous  la  machine.  Le  rouleau  conducteur  du 
papier  est  aussi  très  ingénieusement  combiné. 

Les  machines  additionnant  et  imprimant  à  la  fois  sont 
des  plus  utiles  dans  les  bureaux  de  statistique  où  l'addition 
joue  un  grand  rôle  dans  les  travaux  les  plus  usuels.  Quant 
au  dispositif  imprimeur,  il  a  pour  les  bureaux  de  statis- 
tique une  importance  de  premier  ordre  en  ce  qu'il  permet 
de  contrôler  le  travail  des  employés. 

Certaines  variétés  de  la  machine  à  touches  sont  à  écriture 
visible.  Ce  détail  peut  avoir  une  influence  heureuse  sur  le 
travail  d'un  débutant,  mais  il  ne  paraît  pas  maintenir  cet 
avantage  quand  il  s'agit  d'un  employé  entraîné.  L'emploi 
de  l'électricité  et  l'impression  des  données  confiées  à  la 
machine  sont  les  premières  qualités  qu'on  recherchera  dans 
un  bureau  de  statistique  :  la  première,  à  raison  de  la  facilité 
et  de  la  rapidité  du  travail,  la  seconde,  parce  qu'elle  place 
l'employé  sous  un  contrôle  permanent,  qui  est  nécessaire 
dans  les  travaux  de  l'espèce. 

•Pour  éviter  la  multiplicité  des  touches,  on  a  imaginé  la 
machine  (à  écriture  visible)  comprenant  onze  touches  seu- 
lement :  pour  inscrire  un  nombre,  il  suffit  d'appuyer  sur  les 
touches,  en  prenant  les  chiffres  dans  l'ordre  de  la  dictée  ou 
de  la  lecture,  sans  omettre  de  marquer  aucune  tranche, 
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même  si  elle  est  formée  d'un  zéro,  ni  aucune  décimale  si  la 
précision  du  calcul  va  jusque-là.  La  disposition  du  clavier, 
très  ingénieuse,  permet  à  l'opérateur  d'acquérir  une  grande 
dextérité  et  de  «  toucher  »  la  machine  comme  on  «  touche  » 
le  piano  (voir  fig.  11).  L'appareil  est  pourvu  de  cinq 


FlG.  il. 


touches  spéciales  pour  la  totalisation,  la  répétition,  la 
correction,  l'élimination  ou  la  signalisation  des  données 
numériques  qui  lui  sont  confiées. 

Les  machines  à  additionner  que  nous  avons  passées  en 
revue  comportent  l'enregistrement  écrit  des  données,  indé- 
pendamment des  résultats  qui  apparaissent  aux  lucarnes  ; 
nous  avons  fait  ressortir  l'avantage  de  ce  dispositif  pour 
les  bureaux  de  statistique  où  il  est  indispensable  de  con- 
trôler le  travail  de  nombreux  employés.  Mais,  si  l'on  peut 
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avoir  en  l'opérateur  une  confiance  suffisante  pour  le  faire 
travailler  sans  autre  contrôle  que  celui  résultant  des  com- 
binaisons de  colonnes,  les  machines  dans  lesquelles  la  ma- 
nœuvre se  réduit  au  simple  enfoncement  des  touches  présen- 
tent un  avantage  de  rapidité  évident.  Telle  est  la  machine 


Fig.  12 

de  Felt  et  Tarrant,  portant  le  nom  de  «  comptomètre  », 
reproduite  à  la  figure  12  ci-contre.  Le  clavier  se  compose  de 
9  rangées  de  chiffres  comprenant  chacune  8  touches.  Pour 
additionner,  il  suffit  d'enfoncer  les  touches  correspondant 
aux  chiffres  des  nombres  à  enregistrer  successivement,  en 
observant  l'ordre  des  unités,  dizaines,  centaines,  etc.  Les 
résultats  successifs  se  marquent  dans  les  colonnes  placées 
au  bas  de  l'appareil. 
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Pour  multij)lier,  on  commence  par  enregistrer  le  multi- 
plicande, puis  on  enfonce  les  touches  autant  de  fois  que 
l'exige  le  chiffre  des  unités  du  multiplicateur;  pour  mul- 
tiplier par  les  dizaines,  on  répète  l'enregistrement  du  mul- 
tiplicande en  reculant  d'un  rang  vers  la  gauche  et  on 
enfonce  les  touches  autant  de  fois  qu'il  le  faut  d'après  le 
chiffre  des  dizaines  du  multiplicateur  (1). 

178.  Toutes  les  machines  à  additionner  se  prêtent,  du 
reste,  à  la  multiplication  par  additions  successives,  mais 
il  existe  un  avantage  de  rapidité  en  faveur  des  machines, 
comme  le  comptomètre,  où  il  n'y  a  qu'à  garder  les  doigts 
sur  les  touches  en  les  enfonçant  successivement  un  certain 
nombre  de  fois.  La  multiplication  des  nombres  6.327X6.457, 
par  exemple,  dont  le  produit  est  40.853.439  pourrait  être 
faite  avec  le  comptomètre  en  cinq  secondes.  Ce  sont  des 
résultats  vertigineux,  tenant  plus  du  sport  que  du  calcul. 

Les  machines  à  additionner  peuvent  être  aussi  employées 
à  la  soustraction,  grâce  à  l'usage  des  nombres  complémen- 
taires. «  On  appelle  complément  d'un  nombre,  dit 
M.  d'Ocagne,  celui  qu'il  faut  lui  ajouter  pour  atteindre  la 
puissance  entière  de  10  immédiatement  supérieure;  ce  com- 
plément s'obtient  en  prenant,  à  partir  de  la  gauche,  le 
complément  à  9  de  chacun  des  chiffres,  sauf  pour  le  dernier, 
à  droite,  dont  on  prend  le  complément  à  10  »  (2).  Le  com- 
plément de  3.258  est  donc  6.742  ;  pour  soustraire  un  nombre 
d'un  autre  nombre,  il  faut  diminuer  le  plus  grand  de  la 
puissance  10  immédiatement  supérieure  et  ajouter  au  reste 
le  complément  du  chiffre  le  plus  petit.  Ainsi  48.984  —  3.258 
=  38.984  +  6.742  (45.726),  résultat  qu'on  obtient  au  moyen 
de  l'addition  et  du  calcul  mental.  Le  comptomètre  porte  sur 
son  clavier,  en  caractères  plus  petits,  les  chiffres  com- 


(1)  On  trouvera  une  description  mécanique  du  comptomètre  dans  Jacob: 
Le  calcul  mécanique,  Paris,  1911,  pp.  30-38. 

(2)  Cfr.  M.  d'Ocagne,  loc.  cit.,  p.  37. 
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plémentaires  jusqu'à  9,  ce  qui  contribue  à  la  facilité  d'exé- 
cution du  calcul  indiqué  (fig.  12).  La  répétition  de  la 
soustraction  conduit  à  la  division,  comme  les  additions  suc- 
cessives permettent  de  réaliser  la  multiplication.  La  sous- 
traction est  une  opération  qui  intervient  plutôt  rarement 
en  statistique,  sauf  dans  le  calcul  des  écarts.  Quant  à  la 
division,  elle  est,  au  contraire,  fort  fréquente.  Mais  il  est 
plus  pratique  de  recourir  aux  machinés  construites  spécia- 
lement pour  multiplier  et  pour  diviser  :  chaque  machine 
doit  être  employée  en  vue  du  but  pour  lequel  elle  a  été  con- 
struite; ce  principe  s'applique  aux  machines  à  calculer 
comme  aux  machines-  industrielles. 

179.  Les  machines  à  multiplier  directement  sont  nom- 
breuses. La  première  en  date  est  celle  inventée  en  1820  par 
le  financier  Thomas,  de  Colmar.  Cet  appareil,  très  répandu, 
a  été  décrit  en  détail  par  M.  d'Ocagne,  dans  son  ouvrage 
sur  «  le  calcul  simplifié  »  (1).  Nous  ne  répéterons  pas  ici  la 
description  du  savant  mathématicien  français,  surtout  que 
l'arithmomètre  Thomas-  a  été  remplacé  dans  beaucoup  de 
bureaux  de  statistique  par  des  appareils  plus  récents. 

Plusieurs  machines  à  multiplier  sont  basées  sur  le  prin- 
cipe appliqué  pour  la  première  fois  d'une  façon  pratique 
par  le  Russe  Odhner.  La  roue  à  nombre  variable  de  dents, 
employée  par  Odhner,  remplace  les  tambours  à  neuf  dents 
d'inégale  longueur  en  usage  précédemment.  Les  dents 
peuvent  glisser  dans  des  entailles  convergeant  vers  le 
centre.  M.  Jacob  en  décrit  comme  suit  le  fonctionnement  : 
«  Ces  dents  sont  munies  d'une  saillie,  qui  les  oblige  à  rester 
dans  une  rainure  circulaire  formant  deux  parties  de  rayons 
différents.  En  faisant  tourner  la  partie  extérieure  de  la 
roue  par  rapport  à  la  partie  centrale,  à  l'aide  d'un  levier, 
les  saillies  s'engagent  dans  l'une  ou  l'autre  partie  de  la 
rainure,  ce  qui  fait  sortir  ou  rentrer  les  dents  suivant 


(1)  Cfr.  M.  d'Ocagne,  loc.  cit.,  pp.  45-54. 
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qu  'elles  sont  en  face  de  la  grande  branche  ou  de  la  petite.  » 
Ce  dispositif  a  l'avantage  d'être  peu  encombrant  et  de  créer 
une  résistance  moindre  lors  de  la  mise  en  marche.  La  roue 
Odhner  est  l'organe  qui  caractérise  essentiellement  les  ma- 
chines à  calculer  connues  en  France  sous  le  nom  de  «  Dac- 
tyle »,  en  Allemagne  sous  celui  de  «  Brunsviga  »,  ((  Be- 
rolina  »,  etc. 

Pour  multiplier  un  nombre  par  un  autre,  il  suffit  d'ins- 
crire le  multiplicande  à  l'aide  de  leviers  glissant  dans  les 
rainures  du  tambour,  et  qu  'on  arrête  en  regard  des  chiffres 
convenables  les  unités  à  droite,  puis  les  dizaines,  les  cen- 
taines, etc.,  vers  la  gauche.  On  donne  autant  de  tours  de 
manivelle  de  bas  en  haut  qu'il  y  a  d'unités  à  multiplier,  puis 
on  avance  d'un  cran  la  partie  mobile  guidée  par  une  cré- 
maillère, et  on  commence  la  même  opération  pour  les 
dizaines.  Le  résultat  se  marque  dans  les  lucarnes.  On  remet 
à  zéro  en  tournant  la  clef  placée  à  l'extrémité  de  la  partie 
mobile.  La  division  s'opère  tout  aussi  facilement  que  la 
multiplication.  Ces  machines  ont  été  pourvues,  au  cours  de 
ces  dernières  années,  d'une  série  de  perfectionnements  qui 
en  rendent  l'usage  facile  et  sûr.  Ainsi,  une  des  erreurs  com- 
mises le  plus  fréquemment,  consiste  à  donner  un  tour  de 
manivelle  en  trop  :  il  suffit  de  faire  un  tour  en  arrière  pour 
ramener  les  résultats  à  leur  position  antérieure.  Si  dans 
une  opération  soustractive,  on  retire  d'un  nombre  un  autre 
qui  lui  est  supérieur,  une  sonnerie  avertit  de  l'erreur  com- 
mise. Enfin,  les  modèles  nouveaux  sont  pourvus  d'un 
mécanisme  remettant  à  zéro  tous  les  leviers  à  la  fois.  Il 
existe  aussi  des  types  imprimant  les  résultats.  M.  Jacob  a 
donné  une  description  complète  de  la  «  Brunsviga  »,  que  le 
lecteur  curieux  de  détails  mécaniques  consultera  avec 
intérêt  (1). 

La  machine  de  M.  Otto  Steiger  (1892),  dénommée  «  la  mil- 


(1)  Jacob,  loc.  cit.,  pp.  (13-70. 
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lionnaire  »,  effectue  les  quatre  opérations  fondamentales 
avec  une  grande  rapidité.  Le  principal  avantage  de  cette 

machine  consiste 
dans  la  simplicité 
de  l'opération  la 
plus  fréquemment 
usitée,  la  multipli- 
cation. Alors  que, 
avec  les  autres  ma- 
chines, l'opérateur 
doit  donner  autant 
de  tours  de  mani- 
velle qu'il  y  a  d'uni- 
tés de  chaque  ordre 
dans  le  multiplica- 
teur, il  suffit  ici  de 
placer  une  aiguille 
mobile  sur  le  chif- 
fre correspondant  à 
ce  nombre  d'unités 
et  de  donner  un 
seul  tour  de  mani- 
velle. Pour  multi- 
plier un  nombre  par 
985,  par  exemple, 
il  faut  exécuter, 
avec  les  machines 
ordinaires,  22  tours 
de  manivelle  et,  avec 
«  la  millionnaire  », 
il  n'y  en  a  que  trois 

ifig.is). 

Il  y  a  un  grand  nombre  de  machines  à  multiplier  et  à 
diviser,  dont  quelques  modèles  fonctionnent  à  l'électricité; 
ces  derniers  sont  doués  d'une  grande  rapidité  et  sont  pré- 
cieux pour  le  calcul  des  pourcentages  lorsqu'on  en  a  un 
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grand  nombre  à  déterminer.  En  poussant  le  calcul  jusqu'à 
la  troisième  décimale,  on  arrive  à  des  résultats  d'une  exac- 
titude complète. 

180.  Ainsi  que  le  dit  M.  d'Ocagne,  pour  avoir  l'équivalent 
d'une  règle  à  calcul  de  grande  longueur,  il  suffit  de  frac- 
tionner les  deux  parties  de  la  règle  (la  règle  et  la  réglette) 
en  un  même  nombre  de  parties  égales  et  d'en  placer  les 
segments  les  uns  en  dessous  des  autres  en  les  f  usant  alter- 
ner, après  avoir  eu  soin  de  les  rendre  solidaires.  En  plan, 
on  obtient  ce  qu'on  appelle  une  grille  à  calcul;  en  dévelop- 


pe 14. 

pant  cette  grille  sur  la  surface  d'un  cylindre,  on  obtient  les 
cylindres  à  calcul. 

C'est  à  cette  dernière  catégorie  qu'appartient  le  rou- 
leau-calculateur de  M.  Billeter  (fig.  14).  Cette  machine 
à  diviser,  d'un  usage  remarquablement  pratique  pour 
les  calculs  de  proportions,  se  compose  d'un  cylindre 
métallique  autour  duquel  se  meut  un  second  cylindre 
nommé  «  curseur  »,  composé  d'un  réseau  de  cinquante 
règles  parallèles  ayant  la  longueur  d'une  règle  à  cal- 
cul ordinaire.  Cette  disposition  permet  d'établir  des  di- 
visions beaucoup  plus  nombreuses  et  d'obtenir  des  résul- 
tats beaucoup  plus  précis  qu'avec  la  règle  à  calcul  ordi- 
naire; tandis  que  cette  dernière  ne  donne  que  trois  chiffres, 
dont  deux  exacts  et  le  troisième  approximatif,  le  rouleau 
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nous  fournit  cinq  chiffres  dont  les  quatre  premiers  sont 
exacts  et  le  cinquième  est  à  évaluer.  Le  maniement,  qui 
demande  un  peu  d'habitude  pour  la  lecture,  est  fort  simple  : 
il  consiste  à  placer  le  curseur  à  un  certain  endroit  du  cy- 
lindre. Le  fonctionnement  est  particulièrement  rapide, 
quand  il  s'agit  de  diviser  une  certaine  quantité  en  parts 
proportionnelles,  cas  fort  fréquent  en  statistique  :  il  suffit, 
en  effet,  de  placer  une  fois  le  curseur  à  l'endroit  convenable 
et  de  procéder  à  la  lecture  successive  de  chacun  des  résul- 
tats. 

III.  —  Avantages  des  machines. 

181.  Un  grand  bureau  de  statistique  ne  pourrait  pas  plus 
se  passer  de  machines  à  dépouiller  et  à  calculer  qu'un  éta- 
blissement industriel  moderne  de  moteurs  et  d'un  outillage 
mécanique.  On  a  pu,  dans  certains  cas,  continuer  de  sacri- 
fier aux  vieilles  coutumes,  mais  ce  fut  grâce  au  système  de 
décentralisation;  quand  les  opérations  statistiques  sont 
centralisées,  la  nécessité  de  l'outillage  moderne  s'impose  et 
emporte  les  dernières  résistances.  Celles-ci  viennent  de 
chefs  trop  attachés  à  l'organisation  à  laquelle  ils  sont  dou- 
cement accoutumés;  elles  viennent  aussi  des  employés  qui, 
souvent,  ont  à  l'égard  des  machines  les  mêmes  préjugés  que 
les  ouvriers.  Ces  faibles  résistances  ne  pourront  entraver  le 
progrès  technique,  qui,  par  l'emploi  des  machines,  s'af- 
firme dans  les  directions  énumérées  ci-après  : 

1"  Les  machines  à  dépouiller  et  à  calculer  rendent  pos- 
sibles des  combinaisons  de  données  plus  nombreuses  que 
celles  qu'il  est  permis  de  réaliser  par  les  anciens  procédés. 
Les  travaux  de  statistique  ont  des  limites  déterminées  par 
le  temps  et  l'argent  dont  le  bureau  dispose.  L'organisation 
qui  économise  la  durée  et  la  dépense  augmente  le  domaine 
de  la  statistique  et  présente,  en  conséquence,  une  impor- 
tance scientifique  de  premier  ordre.  M.  Robert  P.  Porter  le 
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constate  en  ces  termes,  à  l'occasion  du  premier  Census  amé- 
ricain dépouillé  à  l'aide  de  la  machine  électrique  de  Holle- 
rith, celui  de  1890  :  «  Grâce  à  l'usage  des  machines  élec- 
triques à  dépouiller,  il  a  été  possible,  dans  le  présent 
recensement,  pour  la  première  fois  dans  l'histoire  du 
travail  statistique,  de  retirer  des  bulletins  toutes  les  infor- 
mations qu'ils  contenaient,  dans  toutes  les  directions 
désirables  »  (Introduction,  Census^  de  1890,  p.  xvn,  compen- 
dium) . 

2°  Le  travail  mental  exigé  par  le  calcul  deviendrait  écra- 
sant dans  les  statistiques  modernes.  Il  ne  s'agit  plus  ici  de 
quelques  additions,  mais  de  centaines  de  milliers  d'opéra- 
tions arithmétiques,  multiplications  et  divisions.  Il  faut 
disposer  d'appareils  se  contrôlant  eux-mêmes,  et  qui  épar- 
gnent au  personnel  la  peine  de  longs  calculs.  «  Combien 
d'observations  précieuses,  a  écrit  un  savant  mathématicien, 
le  général  Menabrea,  restent  inutiles  aux  progrès  des 
sciences,  parce  qu'il  n'y  a  pas  de  forces  suffisantes  pour  en 
calculer  les  résultats.  »  (1). 

Les  machines  décuplent  les  forces  dont  chaque  bureau 
dispose  :  elles  contribuent  donc  directement  au  progrès 
scientifique.  Les  logarithmes  peuvent  être  assimilés  aux 
machines  à  calculer;  Kepler  fut  l'un  des  premiers  et  des 
plus  fervents  adeptes  de  ce  mode  nouveau  de  calcul  et  c'est 
grâce  aux  logarithmes  qu'il  put  dresser  les  tables  d'où  il 
devait  faire  sortir  les  lois  des  mouvements  planétaires  ;  «  de 
sorte  que,  dit  M.  d'Ocagne,  après  avoir  cité  cet  exemple,  si 
les  logarithmes  n'eussent  pas  été  inventés  à  propos  (par 
Neper,  en  1614),  la  loi  de  la  gravitation  universelle  serait 
peut-être  encore  à  découvrir  »  (2)  ; 

3°  En  débarrassant  le  chef  du  bureau  de  statistique  du 
souci  de  l'exactitude  matérielle  des  calculs  effectués  par  ses 


(1)  .Volions  sur  la  machine  analytique,  de  CH.  Babbage  (Bibliothèque  uni- 
verselle de  Genève,  t.  XLI,  p.  352). 

(2)  M.  d'Ocagne,  loc.  cit.,  p.  101. 
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collaborateurs  et  en  lui  permettant  de  réduire  sa  partici- 
pation aux  travaux  matériels  à  un  simple  contrôle,  l'emploi 
des  machines  lui  assurera  la  faculté  de  se  consacrer  da- 
vantage à  la  science  et  de  donner  plus  de  temps  à  la  mise 
en  valeur  des  données  statistiques.  Ici  encore,  la  machine 
concourt  à  un  but  scientifique  supérieur  ; 

4"  Les  résultats  financiers  de  l'emploi  des  machines  se 
modifient,  sans  aucun  doute,  à  chaque  expérience  ;  trop 
d'éléments  variables  interviennent  pour  qu'il  n'en  soit  pas 
ainsi.  Mais  on  ne  peut  mettre  en  doute  que  ces  résultats  ne 
soient  tous  dans  le  sens  d'une  importante  réduction  des 
dépenses.  Sans  doute,  il  ne  faut  pas,  en  pratique,  apprécier 
le  rendement  des  machines  d'après  quelques  éléments  types 
fournis  par  les  constructeurs  et  vendeurs  de  ces  appareils. 
Sans  contester  la  sincérité  des  résultats  produits,  on  peut 
croire  qu'il  s'agit  de  l'effort  tout  momentané  de  quelque 
virtuose;  c'est  un  record  et  non  une  moyenne  de  résultats 
obtenus  après  de  longues  semaines  de  travail.  Mais  c'est  un 
fait  d'expérience  qu'une  bonne  machine  à  calculer  effectue, 
sans  erreur,  le  travail  de  plusieurs  excellents  employés,  et 
c'est  un  résultat  assez  satisfaisant  pour  faire  intervenir  le 
travail  à  la  machine  dans  la  plus  large  mesure  possible. 


CHAPITRE  IV 
La  présentation  des  résultats  statistiques 

I.  —  Règles  pratiques  de  la  présentation  statistique. 

182.  La  présentation  statistique  consiste  dans  le  groupe- 
ment et  l'exposition  des  données  en  vue  de  la  publication. 
Elle  a  pour  objet  de  grouper  les  données  de  même  nature, 
de  telle  façon  que,  par  leur  réunion,  l'esprit  soit  frappé  de 
certains  résultats;  en  même  temps  qu'elle  place  les  résul- 
tats sous  les  yeux  du  chercheur,  elle  dispose  le  matériel  en 


LA  PRÉSENTATION  DES  RÉSULTATS  STATISTIQUES  295 

sorte  de  permettre  de  nouvelles  combinaisons  de  données  et 
de  nouvelles  recherches  interprétatives. 

C'est  à  l'expérience  à  apprendre  la  manière  de  présenter 
les  données  statistiques  en  tableaux  clairs,  bien  ordonnés, 
ni  trop  simples,  ni  surchargés.  Cet  art  ne  peut  guère  s'en- 
seigner, mais  il  est  un  ensemble  de  recommandations  dont 
on  fera  bien  de  ne  pas  s'écarter  si  l'on  tient  à  rester  dans 
la  norme  des  publications  ayant  une  bonne  tenue  scien- 
tifique. 

A  quel  moment  faut-il  s'occuper  de  la  préparation  des 
cadres  de  publication?  Nous  répondons,  sans  hésitation  : 
dès  le  début  du  travail,  avant  même  de  rédiger  le  question- 
naire ou  bulletin.  Il  faut  savoir  où  l'on  va  pour  ne  pas  sur- 
charger le  bulletin  de  questions  inutiles,  ni  omettre  l'un  ou 
l'autre  point  essentiel.  Dresser  un  schéma  du  cadre  de  pu- 
blication est  la  meilleure  préparation  qu'on  puisse  imaginer 
à  la  rédaction  du  bulletin.  Puis,  après  la  critique,  on  verra 
quelles  sont  les  données  utilisables  et  on  décidera  dans 
quelle  forme  elles  doivent  être  publiées  :  c'est  la  phase  défi- 
nitive de  la  préparation  des  cadres.  Les  différentes  parties 
de  la  statistique  sont  ainsi  solidaires  :  le  contenu  du  bulletin 
dépend  du  but  de  la  statistique,  qui  est  exprimé  dans  les 
cadres  et  les  cadres  eux-mêmes  dépendent  des  réponses  du 
bulletin,  modifiées  par  la  critique.  Les  trois  parties  de  la 
statistique  que  nous  avons  exposées  jusqu'ici  se  compé- 
nètrent  donc  réciproquement. 

Le  principe  essentiel  en  la  matière  est  l'ordre  et  la  clarté. 
On  ne  perdra  pas  de  vue  que  les  statistiques  sont  faites 
pour  fournir  des  renseignements  au  public  et  non  pour  exer- 
cer l'ingéniosité  du  lecteur  en  lui  posant  des  énigmes.  Tout, 
dans  la  présentation,  doit  obéir  à  ce  principe  fondamental  : 
énoncé  des  titres,  disposition  des  colonnes,  rédaction  des 
notes.  Un  tableau  bien  fait  doit  se  lire  facilement,  les 
recherches  doivent  y  être  aisées,  on  doit  ressentir,  en  le 
regardant,  une  impression  d'ordre,  comprendre  qu'on  se 
trouve  devant  un  plan  logiquement  ordonné.  Nous  passe- 
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rons  rapidement  en  revue  quelques  points  se  rattachant  à 
cette  question  générale. 

A)  Faut-il  un  cadre  unique,  ou  est-il  préférable  d'en  com- 
poser plusieurs?  Il  est  rare  qu'une  statistique,  tant  soit  peu 
complexe,  puisse  tenir  en  un  cadre  unique.  Si  l'on  veut  s'as- 
treindre à  cette  règle,  on  court  risque  d'aboutir  à  une 
grande  confusion,  de  manquer  absolument  de  clarté.  Un 
cadre  doit  avoir  son  objet  propre  et  présenter  au  complet 
les  données  numériques  concernant  cette  question.  En 
général,  il  est  donc  préférable  qu'une  statistique  soit  pré- 
sentée en  plusieurs  cadres,  chacun  d'eux  étant  relatif  à  une 
question  ou  à  un  groupe  de  questions. 

B)  Chaque  tableau  doit  avoir  son  titre  et  ce  titre  doit 
indiquer  exactement,  sans  omission  et  sans  ajoute,  le  con- 
tenu du  tableau.  Le  lecteur  doit  être  informé,  en  lisant  le 
titre  seul,  de  ce  qu'il  va  trouver  dans  le  cadre  statistique. 
Non  seulement,  l'objet  matériel  doit  être  indiqué,  mais 
encore  le  point  de  vue  sous  lequel  il  est  envisagé.  Si  l'on 
éprouve  quelque  difficulté  à  libeller  cet  énoncé,  ce  peut  être 
un  indice  que  le  cadre  est  surchargé.  Ces  remarques  s'ap- 
pliquent aussi  aux  intitulés  des  colonnes. 

C)  En  général,  une  donnée  statistique  pour  acquérir  toute 
sa  signification,  doit  être  présentée  en  nombres  absolus  et 
en  pourcentages.  Mais  faut-il  réunir  ces  deux  espèces  de 
données  en  un  cadre  unique,  ou  consacrer  un  cadre  spécial  à 
chacune  d'elles?  Dans-  les  tableaux  statistiques  qui  forment 
l'exposé  systématique  du  matériel,  les  tableaux  de  publica- 
tion proprement  dits,  il  ne  faut  pas  de  chiffres  proportion- 
nels. On  se  borne  là  à  montrer  les  résultats  tels  qu'ils  ont 
été  calculés,  on  n'a  pas  à  les  comparer  à  d'autres.  Il  en  va 
autrement  dans  les  tableaux  d'analyse  :  là,  les  chiffres 
proportionnels  trouvent  un  emploi  constant  et  sont  un 
moyen  d'investigation  indispensable.  Nous  ne  sommes  pas 
partisan  de  les  publier  isolément,  car  un  pourcentage  séparé 
du  nombre  absolu  qu'il  représente  est  souvent  trompeur. 
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Une  augmentation  relative  peut  être  énorme  et  ne  corres- 
pondre qu'à  un  chiffre  absolu  de  fort  médiocre  importance. 
Le  pourcentage  isolé  nous  induit  en  erreur  plutôt  qu'il  ne 
nous  éclaire. 

D)  Le  nombre  de  colonnes  dépend  d'un  fait  matériel;  le 
format  de  la  publication,  et  de  deux  autres  éléments:  la 
complexité  de  la  matière  et  le  détail  dans-  lequel  on  désire 
entrer.  On  peut  adopter,  pour  règle  générale,  de  sub- 
diviser la  question  en  partant  de  la  classe  la  plus  générale 
pour  arriver  à  la  plus  spéciale,  comme  dans  l'exemple  ci- 
après,  où  il  s'agit  de  la  répartition  d'une  population  selon 
l'âge,  le  sexe  et  l'état  civil,  dans  les  villes  et  les  campagnes. 

1.  Province  de  Brabant 


2.  Localités  urbaines.  Localités  rurales. 


4.       Hommes,  Femmes.  Hommes.  Femmes. 

16.  Cél.  mar.  veufs  Cél.  mar.  veuves  Cél.  mar.  veufs  Cél.  mar.  veuves 
div.  div.  div.  div. 

■  J     La  présentation  par  tableau  à  double  entrée,  comme 

19-30  »  /  l'exemple  ci-contre,  équivaut  à  multiplier  le  nombre 

30-50  »  \  des  colonnes  :  le  résultat  est  le  même  que  si  chaque 

50-60  »  l  colonne  était  partagée  en  cinq  subdivisions,  ce  qui 

60  et  plus.  J  ferai1  5  x  16  ou  80  colonnes. 

E)  Une  autre  question,  fort  intéressante,  est  colle-ci  :  quelles 
sont  les  données  qui  devraient  être  publiées  isolément  ?  Faut- 
il,  dans  la  statistique  d'un  pays,  descendre  jusqu'à  l'unité 
géographique  la  plus  faible,  la  commune,  ou  peut-on  s'arrê- 
ter en  deçà  ?  C'est  un  problème  qui  se  pose  à  tout  instant  et 
qui  a  soulevé  de  vives  controverses.  Nous  pensons  que 
sa  solution  n'a  rien  d'impossible.  En  principe,  il  faut  des- 
cendre dans  les  plus  petits  détails,  parce  qu'en  dehors  do 
ce  qui  est  publié,  le  chercheur  ne  peut  pas  disposer  du  ma- 
tériel rassemblé  par  le  statisticien.  Mais,  il  ne  faut  pas  que 
ce  souci  aille  jusqu'à  la  minutie.  On  peut,  on  doit  adopter 
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des  régies  dont  l'effet  est  de  réduire  la  longueur,  partant  le 
coût  et  la  durée  des  publications.  Ainsi,  pour  le  recensement 
industriel  belge  de  1910,  nous  avions  pris  pour  règle  de  ne 
citer  que  des  communes  où,  dans  l'industrie  considérée,  dix 
personnes  au  moins  travaillaient  (patrons  et  ouvriers  réu- 
nis). Les  communes  non  citées  étaient  réunies  sous  la  déno- 
mination «  autres  communes  ».  Ce  simple  principe  d'élimi- 
nation, qui  n'enlève  rien  de  leur  valeur  aux  données 
statistiques,  a  eu  pour  effet  d'alléger  la  publication  de 
plusieurs  milliers  de  lignes  dénuées  d'intérêt. 

183.  La  forme  matérielle  de  la  présentation  peut  aussi 
faire  l'objet  de  quelques  remarques. 

A)  Le  format  de  la  publication  doit  être  l'objet  d'une 
sérieuse  attention.  Les  formats  trop  petits  ne  se  prêtent  pas 
à  l'impression  de  tableaux  statistiques,  à  moins  d'employer 
des  caractères  microscopiques,  fatigants  pour  tout  le 
monde,  illisibles  pour  quelques-uns.  On  adopte  générale- 
ment l'in-8°  pour  les  «  Annuaires  »,  qui  publient  surtout 
des  tableaux  résumés,  et  on  réserve  l'in-4°  aux  grandes  pu- 
blications statistiques.  Les  formats  plus  grands  se 
placent  difficilement  dans  les  bibliothèques  :  sauf  des  cas 
spéciaux,  comme  lorsqu'il  s'agit  de  collections  commencées 
depuis  longtemps,  les  grands  formats,  comme  les  in-folio, 
ne  sont  pas  à  recommander. 

B)  Un  tableau  statistique  peut  être  imprimé  sur  deux 
pages  à  condition  que  le  repérage  des  lignes  soit  très  exact, 
mais  jamais  sur  quatre.  Pour  pouvoir  consulter  utilement 
une  statistique,  il  faut  que  l'on  ait  sous  les  yeux,  à  la  fois, 
toutes  les  données  du  tableau. 

C)  Le  papier  employé  doit  être  mince  et  résistant.  Il  ne 
faut  pas  viser  à  l'effet  en  grossissant  les  volumes;  il  faut 
songer  que  les  publications  volumineuses  font  l'effroi  des 
bibliothécaires. 

D)  Un  tableau  statistique  doit  être  rempli,  c'est-à-dire 


i.a  Présentation  des  résultats  statistiques 


•299 


que  toutes  ses  colonnes  doivent  être  fournies  de  chiffres. 
S'il  en  est  autrement,  revoyez  attentivement  votre  classifi- 
cation de  base  et  vos  en-têtes  de  colonnes  :  il  y  a  quelque 
part  des  divisions  plus  minutieuses  qu'il  ne  conviendrait. 

E)  Lorsque  la  page  est  couverte  de  chiffres,  on  obtient 
un  bon  résultat  pour  la  clarté  en  laissant  une  ligne  de  blanc 
de  cinq  en  cinq,  ou  de  dix  en  dix  lignes.  Lorsque  les  résultats 
sont  présentés  par  années,  on  peut  introduire  cette  ligne  de 
blanc  après  chaque  décade. 

Dans  un  but  identique,  on  peut  numéroter  les  données  et 
répéter  ces  indications  à  droite  et  à  gauche  du  cadre.  Le 
nom  des  localités  ou  les  chiffres  des  années  peuvent  aussi 
faire  l'objet  d'une  double  inscription  —  à  gauche  et  à 
droite. 

F)  Les  totaux  dans  les  publications  anciennes  sont  géné- 
ralement placés  à  la  fin  des  colonnes  et  le  total  général  qui 
résume  les  totaux  partiels  des  colonnes  se  trouve  à  droite. 
Partant  de  cette  idée  que  le  total  est  le  chiffre  qu'on  cherche 
en  premier  lieu,  les  statisticiens  anglais  et  américains  ont 
pris  pour  règle  de  placer  la  colonne  des  totaux  à  gauche,  et 
même  de  faire  précéder  les  chiffres  de  détail,  du  total  géné- 
ral pour  le  Royaume.  L'innovation  peut  avoir  du  bon,  mais 
il  ne  peut  être  question  de  condamner  le  procédé  ancien. 

Si  les  données  doivent  être  comparées,  il  est  recomman- 
dable  de  rapprocher  les  colonnes  de  totaux  se  rapportant  à 
ces  données. 

G)  Les  colonnes  doivent  être  combinées  de  façon  à  assurer 
une  série  de  contrôles  permettant  de  vérifier  l'exactitude 
matérielle  du  dépouillement  et  des  additions.  Lorsque  ces 
contrôles  sont  bien  établis  et  qu'on  prend  la  peine  de  les 
vérifier  avec  attention,  les  erreurs  sont  infiniment  réduites. 
Les  employés,  sachant  que  leur  travail  est  contrôlé,  y  met- 
tent d'autant  plus  de  soin. 

H)  Les  «  coquilles  »  sont  toujours  désagréables,  mais 
dans  un  travail  de  statistique  elles  sont  désastreuses.  On  ne 
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peut  donc  apporter  trop  de  soins  à  la  correction  des 
épreuves,  ni  montrer  trop  d'exigences  à  l'égard  de  la  capa- 
cité professionnelle  de  l'imprimeur.  Les  ((  bons  à  tirer  » 
doivent  être  revus  avec  attention  par  une  personne  quali- 
fiée, le  chef  du  bureau  lui-même,  s 'il  se  peut. 
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PROCÉDÉS  D'ANALYSE  DU  MATÉRIEL 
STATISTIQUE 

Généralités  et  division  de  la  matière 


185.  Au  cours  de  l'exposé  compris  dans  les  trois  sections 
qui  composent  le  livre  premier,  nous  avons  passé  en  revue 
les  phases  du  travail  statistique  en  tant  qu'elles  concernent 
le  relevé,  la  critique,  le  dépouillement  et  la  présentation  des 
données.  On  pourrait  appeler  cette  partie  la  «  formation 
des  tableaux  primaires  ».  Le  dépouillement  et  la  présenta- 
tion ne  font  que  placer  sous  les  yeux  du  lecteur  les  résultats 
bruts  de  l'observation,  en  les  classant  d'après  les  divisions 
des  nomenclatures  et  en  les  totalisant  par  groupe  ou  classe. 
Mais  une  phase  nouvelle  va  s'ouvrir.  Il  ne  suffit  pas 
d'exposer,  après  l'avoir  classé,  le  matériel  statistique.  Cette 
suite,  déjà  longue,  d'opérations  que  nous  avons  décrite, 
pourrait  se  comparer  au  travail  du  naturaliste  qui  recher- 
che des  types  d'animaux,  s'efforce  de  les  saisir  dans  leurs 
conditions  de  vie,  de  les  présenter  in  situ  et  puis  les  range, 
par  espèces  et  familles,  dans  les  vitrines  d'un  musée.  L'his- 
toire naturelle  n'eût  fait  que  des  progrès  bien  lents  si  l'on 
s 'en  était  tenu  à  cette  science  purement  descriptive.  Aussi  la 
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tâche  des  conservateurs  et  du  directeur  d'un  musée  d'his- 
toire naturelle  ne  s'arrête  pas  là.  Il  leur  reste  à  mettre  en 
œuvre  les  matériaux  recueillis,  à  les  comparer,  à  rechercher 
les  relations  des  êtres  entre  eux  (rapports  statistiques, 
dynamiques  et  organiques),  à  étudier  la  variation  des  êtres 
dans  leur  nature,  leur  origine  et  leur  fin,  à  tirer  les  conclu- 
sions d'ordre  scientifique  qui  se  dégagent  de  cet  examen  (1). 
La  seconde  partie  des  opérations  statistiques  que  nous  exa- 
minons au  cours  du  présent  livre  ressemble  à  ce  travail 
d'analyse.  Le  statisticien,  comme' le  naturaliste,  doit  aussi 
comparer  entre  eux  les  matériaux  mis  à  sa  disposition  — 
pour  lui,  ce  sont  les  données  statistiques  formées  à  l'aide 
des  calculs  du  dépouillement  —  et  il  faut  trouver  les  expres- 
sions synthétiques  qui  résument,  le  plus  exactement  pos- 
sible, la  masse  des  constatations  numériques.  Le  langage 
que  tiennent  les  chiffres  est  plein  d'obscurités  et  d'em- 
bûches :  l'égyptologue,  courbé  sur  ses  palimpsestes,  n'a 
guère  plus  de  difficultés  à  vaincre  que  le  statisticien  n'en 
rencontre  au  cours  de  l'analyse  de  son  matériel.  Ce  n'est 
que  par  là  cependant  qu'il  arrive  à  dégager  les  traits  géné- 
raux, à  marquer  les  ressemblances,  à  mesurer  les  diffé- 
rences, à  présenter  à  l'homme  d'étude  les  éléments  simples 
dont  celui-ci  a  besoin  pour  rechercher  les  tendances  régu- 
lières et  les  causes  des  phénomènes. 

L'exposé  de  ces  procédés  d'investigation  scientifique 
forme  la  matière  de  notre  second  livre. 

186.  On  pourrait  la  diviser  en  tenant  compte  de  la 
nature  des  opérations  mathématiques  à  effectuer  et  con- 
sidérer d'abord  les  procédés  d'analyse  basés  sur  l'arithmé- 
tique, puis  ceux  fondés  sur  l'algèbre  et  enfin  ceux  qui  se 
démontrent  par  la  géométrie.  Dans  la  première  catégorie 


(lj  Voyez,  par  exemple,  le  tableau  synoptique  résumant  le  programme  de 
travail  en  histoire  naturelle,  inséré  à  la  fin  du  mémoire  de  G.  Gilson.  déjà 
cité  (Bruxelles,  1914). 
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rentrent  les  moyennes,  les  proportions  et  rapports,  etc.; 
à  la  seconde  appartiennent  l'interpolation  et  la  théorie  de 
la  corrélation;  dans  la  troisième  se  rangent  les  procédés 
divers  de  la  statistique  graphique. 

Mais  il  serait  permis  de  reprocher  à  cette  classification 
quelque  chose  d'arbitraire,  car  les  formules  que  nous  ren- 
contrerons au  cours  de  notre  exposé  peuvent  en  général  se 
démontrer  à  la  fois  par  l'algèbre  et  la  géométrie. 

Nous  avons  préféré  conserver,  dans  ce  livre,  comme  nous 
l'avions  fait  dans  le  livre  premier,  l'ordre  logique  des  opé- 
rations statistiques,  car  nous  écrivons  pour  les  statisti- 
ciens, avant  tout. 

D'après  cet  ordre,  nous  considérerons  d'abord  les  séries 
et  leurs  modalités,  ainsi  que  les  différentes  formes  de  dis- 
tribution. Puis  nous  envisagerons  les  mesures  diverses  des 
séries  :  les  moyennes  et  le  calcul  de  la  dispersion.  Nous 
étudierons  ensuite  la  manière  de  fixer  le  rapport  de 
dépendance  des  phénomènes;  c'est  la  théorie  des  corré- 
lations. Nous  verrons,  après  cela,  ce  qui  a  trait  à  la  statis- 
tique graphique.  Nous  terminerons  enfin  par  l'exposé  de 
la  loi  des  erreurs. 

Il  n'est  pas  inutile  de  rappeler  ici  le  point  de  vue  général 
que  nous  avons  exposé  dans  notre  introduction  sous  le  titre 
de  :  «  La  statistique  et  les  mathématiques  ». 

Sans  aucun  doute,  les  mathématiques  et  la  statistique  ne 
se  confondent  pas  et  on  a  vu  de  bons  statisticiens  sans 
connaissances  plus  approfondies  que  les  mathématiques 
élémentaires.  Mais  les  domaines  de  ces  méthodes  scien- 
tifiques se  touchent  et  leurs  fonctions  sont  communes, 
si  bien  qu'on  ne  peut  décrire  toute  la  méthode  sta- 
tistique sans  en  venir  à  toucher  le  domaine  des  ma- 
thématiques. Ceci  est  particulièrement  vrai  à  propos 
de  la  matière  traitée  au  cours  des  livres  II  et  III. 
Si  l'on  peut  faire  en  quelque  sorte  abstraction  des 
mathématiques  quand  il  s'agit  du  but  concret  de 
recueillir,  ordonner,  dépouiller  et  publier  les  documents 
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statistiques,  il  n'en  est  plus  de  même  lorsqu'il  faut 
analyser,  comparer  et  vérifier  les  résultats  qui  s'en 
dégagent.  Encore  une  fois, -il  ne  peut  être  question  que  de 
domaines  voisins,  mais  ne  formant  pas  un  territoire  unique. 
Il  y  a  juxtaposition,  non  compénétration.  Le  statisticien  a 
recours  aux  procédés  mathématiques;  il  s 'appuyé  sur  les 
théorèmes  de  la  géométrie  et  de  l'algèbre,  il  doit  montrer 
quelle  est  leur  signification  par  rapport  aux  phénomènes 
décrits  par  la  méthode,  il  ne  doit  pas  nécessairement  en 
refaire,  après  d'autres,  la  démonstration.  Cette  tâche  in- 
combe proprement  aux  mathématiciens.  Chercher  et  dé- 
montrer, par  les  procédés  mathématiques,  que  tel  résultat 
s'obtient  par  telle  formule,  nous  semble  rentrer  dans  le 
rôle  du  mathématicien.  Faire  emploi  de  cette  formule,  mon- 
trer comment  elle  s'applique  à  des  phénomènes  statistiques, 
nous  paraît  la  tâche  du  statisticien.  Toutefois  cette  distinc- 
tion n'a  rien  d'absolu;  il  est  bien  difficile  de  faire  l'une  ou 
l'autre  application  rai  sonnée  sans  y  joindre  au  moins  une 
démonstration  élémentaire.  On  a  fait  remarquer  avec  rai- 
son que,  privée  de  toute  démonstration  mathématique,  la 
description  des  procédés  statistiques  ne  serait  plus  qu'un 
recueil  de  «  recettes  »,  vide  de  toute  pensée  scientifique.  Il 
faut  donc  s'efforcer  de  rester  dans  un  juste  milieu.  C'est 
de  cette  pensée  que  nous  nous  sommes  inspiré  au  cours  des 
pages  suivantes. 
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CHAPITRE  PREMIER. 
Séries,  sériation,  distribution 

I.  —  Les  séries  statistiques. 

187.  Pour  acquérir  toute  la  valeur  dont  elle  est  suscep- 
tible, l'observation  statistique  doit  être  la  plus  longue  et  la 
plus  étendue  possible.  La  plus  longue  possible,  afin  que  les 
faits  relevés  acquièrent  toute  leur  signification  en  dépouil- 
lant les  caractères  accidentels  qu'ils  peuvent  présenter 
dans  certains  ca&  isolés  ;  la  plus  étendue  possible,  afin  que 
les  caractères  généraux  se  réflètent  dans  l'observation  et 
non  pas  ceux  qui  ne  sont  qu'exceptionnels. 

Une  succession  de  données  résultant  de  l'observation 
quantitative  d'un  fait  non  typique,  répétée  dans  le  temps  ou 
dans  l'espace,  prend  le  nom  de  série. 

Les  statisticiens  n'ont  pas  toujours  paru  attacher  une 
importance  suffisante  à  la  question  de  la  classification  des 
séries.  Cependant,  si  l'on  veut  y  réfléchir  un  instant,  on 
s'apercevra  que  les  résultats  de  la  statistique  d'investiga- 
tion sont  très  différents  selon  qu'ils  s'appliquent  à  une  es- 
pèce de  séries,  ou  à  une  autre  espèce. 

Ou  bien  les  phénomènes  sont  observés  par  la  statistique 
d'après  des  divisions  du  temps,  ou  bien  ils  le  sont  selon  des 
divisions  de  l'espace. 

Ceci  fournit  une  base  de  classification  rationnelle.  Nous 
aurons  en  premier  lieu  des  séries  dan&  lesquelles  l'évolu- 
tion du  phénomène  est  considérée  dans  le  temps  ;  ce  seront 
les  séries  chronologiques  ou  historiques. 

D'autre  part,  nous  distinguerons  les  séries  dans  les- 
quelles l'élément  de  succession  dans  le  temps  fait  défaut, 
mais  dans  lesquelles  l'observation   statistique,  supposée 
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faite  à  un  moment  donné,  s'applique  à  des  endroits  diffé- 
rents du  territoire.  Ces  séries  montrent  les  variations  du 
phénomène  dans  l'espace. 

Mais  certains  phénomènes  peuvent  être  étudiés  en  eux- 
mêmes,  sans  considération  du  temps  et  de  l'espace,  mais 
simplement  dans  le  but  de  montrer  la  distribution  des  élé- 
ments variables  dont  ils  se  composent.  Et  ceci  nous  fournit 
une  nouvelle  base  de  classification  des  séries. 

Somme  toute,  la  classification  proposée  n'a  rien  de  nou- 
veau dans  la  statistique.  Nous  la  retrouverons  dans  l'ex- 
posé de  la  statistique  graphique.  Bien  qu'il  soit  peu  dési- 
rable, dans  un  exposé  méthodique,  d'anticiper  sur  les  déve- 
loppements de  la  matière,  nous  devons  signaler  ici  que  la 
statistique  graphique  divise  les  diagrammes  en  deux 
classes  :  les  diagrammes  historiques  ou  chronologiques  qui 
représentent  les  faits  d'après  leur  évolution  au  cours  des 
années,  et  les  diagrammes  de  distribution  qui  montrent  la 
répartition  des  fréquences,  sans  intervention  de  la  notion 
de  temps.  A  ces  deux  modes  de  réprésentation,  la  statis- 
tique graphique  en  ajoute  un  troisième  qui  envisage  la  ré- 
partition dans  l'espace  :  les  cartogrammes. 

Les  divisions  sont  exactement  celles  proposées  à  l'égard 
des  séries  (1). 

188.  Le  premier  groupe  est  formé  des  séries  basées  sur 
une  mesure  du  temps. 

L'unité  de  temps  admise  est  souvent  l'année.  On 
peut  adopter  l'année  astronomique  ou  l'année  fiscale 
ou  financière.  Cette  dernière  unité  n'est  employée  que 
dans  des  statistiques  spéciales  ayant  trait  aux  finances 
publiques  ou  privées.  Il  y  a  toujours  lieu  de  pré- 
ciser la  nature  de  l'unité  de  temps  dont  on  se  sert.  Les 


(1)  Cette  classification  est  celle  proposée  par  M.  Edmond  F.  Day  dans  un 
article  paru  dans  «  Quarterly  publications  of  the  American  Statistical  Asso- 
ciation »,  vol.  XVI,  n°  128  (1919)  ;  nous  l'avions  nous-même  adoptée  en  partie 
dès  1917. 
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statistiques  ayant  l'année  comme  mesure  sont  extrêmement 
nombreuses.  Parmi  elles,  on  peut  citer,  à  titre  d'exemple, 
les  statistiques  criminelles;  nous  en  donnons  ci-après  un 
spécimen  : 

Exemple  1. 


Années 

NOMBRE  DR  CONDAMNÉS  (1) 

HOM MES 

FEMMES 

TOTAL 

des 
hommes 
et  des 
femmes 

Primaires 

Récidivistes 

Total 

Primaires 

Récidivistes 

Total 

1900 

23,099 

18,134 

41,233 

9,203 

3,251 

12,454 

53,687 

1905 

20,024 

19,334 

39,358 

8,548 

4,141 

12,689 

52,047 

1906 

21,307 

20,410 

41,717 

8,432 

4,448 

12,880 

54,597 

1907 

20,446 

20,522 

40,968 

8,120 

4,417 

12,537 

53,505 

1908 

19,919 

20,016 

39.935 

8,184 

4,208 

12,392 

52,327 

1909 

18,674 

18,915 

37,589 

8,156 

4,449 

12,605 

50,194 

1910 

20,443 

20,269 

40,712 

8,135 

4,573 

12,708 

53,420 

1911 

19,278 

19,129 

38,407 

7,879 

4,351 

12,230 

50,637 

1912 

20,818 

2  ,414 

41,232 

8,407 

4,841 

13,248 

54,480 

L'année  astronomique  ou  encore  l'année  budgétaire  con- 
stitue souvent  une  mesure  trop  large  pour  apprécier,  avec 
la  précision  voulue,  certains  phénomènes  qui,  au  cours 
d'une  même  année,  subissent  des  fluctuations  périodiques, 
ou  dont  on  désire  suivre  le  développement  à  intervalle  plus 
rapproché.  Le  commerce  a  intérêt,  par  exemple,  à  connaître 
l'allure  des  échanges  internationaux  dans  le  plus  bref  délai 
possible;  aussi  les  statistiques  commerciales,  qui  ne  sont 
définitivement  closes  qu'après  l'année  écoulée,  paraissent- 
elles,  sous  une  forme  provisoire  et  abrégée,  de  mois  en 
mois.  Quelques  statistiques  sont  publiées,  sous  cette  même 
forme  provisoire,  tous  les  six  mois  ;  il  en  est  ainsi  du  relevé 
de  la  production  et  du  personnel  dans  les  mines  de  houille 
et  les  usines  métallurgiques  en  Belgique. 


(1)  D'après  la  «  Statistique  judiciaire  de  la  Belgique  »,  publiée  par  le 
Ministère  de  la  Justice.  Bruxelles,  in-folio  (paraît  annuellement). 
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Dans  certains  cas,  la  publication  mensuelle  et  la  forma- 
tion de  séries  établies  pour  chaque  moi&  sont  d'une  impé- 
rieuse nécessité,  afin  de  suivre  les  variations  constantes 
d'un  fait  dépendant  essentiellement  de  l'époque  à  laquelle 
il  se  produit  :  telles  sont  les  statistiques  météorologiques. 
Le  relevé  des  heures  d'illumination  solaire  fournit  un 
exemple  typique  de  ce  genre  de  séries. 


Exemple  2.  —  Heures  de  soleil,  à  Uccle  (Totaux  mensuels). 

Institut  météorologique  de  Belgique  (1). 


Années 

Janvier 

Février 

Mars 

Avril 

S 

Juin 

Juillet 

Août 

Septembre! 

Octobre 

Novembre 

Décembre 

Total 

1898 

57 

54 

87 

205 

146 

176 

202 

278 

224 

108 

104 

67 

1708 

1899 

92 

134 

168 

133 

194 

262 

271 

275 

172 

195 

76 

62 

2034 

1900 

33 

70 

101 

170 

211 

192 

296 

205 

197 

147 

44 

48 

1714 

1901 

98 

65 

78 

193 

283 

236 

254 

223 

160 

126 

95 

30 

1841 

1902 

27 

99 

118 

145 

175 

212 

235 

155 

142 

77 

95 

59 

1539 

1903 

75 

60 

150 

107 

237 

186 

179 

178 

162 

95 

51 

61 

1541 

1904 

60 

71 

66 

162 

183 

215 

309 

275 

161 

114 

53 

37 

1706 

1905 

81 

59 

117 

120 

228 

214 

242 

200 

115 

66 

45 

42 

1529 

1906 

69 

48 

133 

219 

177 

194 

215 

229 

187 

134 

51 

48 

1704 

1907 

51 

64 

184 

134 

244 

162 

177 

205 

188 

92 

72 

49 

1622 

1908 

96 

44 

77 

139 

162 

212 

211 

201 

182 

207 

109 

39 

1679 

1909 

93 

116 

70 

235 

329 

141 

134 

228 

130 

106 

89 

36 

1707 

1910 

51 

68 

179 

164 

188 

169 

127 

186 

132 

115 

55 

27 

1461 

1911 

55 

64 

107 

184 

230 

184 

327 

280 

229 

131 

67 

25 

1883 

1912 

33 

64 

89 

232 

180 

176 

197 

108 

109 

144 

27 

49 

1408 

189.  Quelquefois,  les  exigences  de  la  recherche  scienti- 
fique rendent  nécessaire  une  division  du  temps  plus  courte 
que  le  mois  :  la  journée,  par  exemple.  La  statistique  des 


(1)  Extrait  de  V Annuaire  météorologique  pour  191J/,  Bruxelles,  1915. 
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accidents  du  travail  a  montré  que  les  sinistres  étaient  plus 
fréquents  certains  jours  que  d'autres.  Si  les  ouvriers  n'ont 
pas  la  sagesse  de  vivre  sobrement  le  dimanche,  l'ébranle- 
ment nerveux  produit  par  l'ivresse  manifestera  ses  effets 
pendant  la  journée  du  lundi  et  provoquera,  ce  jour-là  un 
plus  grand  nombre  d'accidents;  il  se  peut  aussi  que  la  fa- 
tigue accumulée  au  cours  de  la  semaine  amène  l'épuisement 
et  que  cet  état  ait  pour  conséquence  un  plus  grand  nombre 
d'accidents  vers  la  fin  de  la  semaine.  Ces  constatations  ne 
sont  possibles  que  par  l'enregistrement  des  accidents,  jour 
par  jour.  Bien  entendu,  ces  chiffres,  pour  revêtir  leur  signi- 
fication exacte,  doivent  être  mis  en  rapport  avec  le  nombre 
d'ouvriers  occupés  chacun  des  jours  de  la  semaine,  et  seu- 
lement pour  des  journées  de  durée  normale. 

Exemple  3.  —  Relevé  des  accidents  du  travail  par  jour. 

(Allemagne,  1907)  (  1  )  : 

Lundi       13,707  ou  16.44  %  Vendredi  13,173  ou  16.28  % 

Mardi       12,752  ou  15.76  %  Samedi    13,603  ou  16.80  % 

Mercredi  12,668  ou  15.66  %  Dimanche  2,036  ou    2.52  % 

Jeudi        12,997  ou  16.4  %  Ensemble  80,916  ou  100.00  % 

.190.  Dans  certaines  recherches,  on  est  allé  plus  profond 
encore  en  présentant  les  séries  statistiques  d'après  une 
unité  extrêmement  réduite  :  l'heure.  On  a  appliqué  cette 
échelle  à  la  statistique  des  décès  et  des  naissances.  M.  Raseri 
a  pu  établir  que  le  nombre  moyen  des  naissances  et  le 
nombre  moyen  des  décès  varient  entre  des  limites  très 
étendues  suivant  les  heures  de  la  journée.  Par  1,000  décès 
qui  se  vérifient  dans  les  24  heures,  la  moyenne  horaire  est 
49  entre  2  heures  de  l'après-midi  et  7  heures  du  soir,  et 


(1)  Données  extraites  de  Ueiverbc-Unfallstatistik  fur  dos  Jahr  1901,  Erster 
Teil.  Berlin,  1910,  tabelle  II. 
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elle  est  seulement  34  entre  7  heures  du  matin  et  2  heures  de 
l'après-midi.  Par  1,000  naissances,  la  moyenne  horaire  est 
52  entre  1  heure  et  8  heures  du  matin,  tandis  qu'elle  est 
seulement  de  39  entre  1  heure  de  l'après-midi  et  8  heures 
du  soir.  Voici  la  répartition  des  décès,  d'après  les  heures, 
enregistrés  à  Crémone  de  1866  à  1880  (1)  : 


Exemple  4. 


Heures 

Décès 

Proportion 
à  1,000 

Heures 

Décès 

Proportion 
à  1,000 

1 

2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 

1,069 
957 
1,136 
1,032 
1,085 
1,103 
1,029 
968 
1,047 
1,077 
1,000 
1,081 

42 
38 
45 
41 
43 
43 
40 
38 
41 
42 
39 
42 

13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 

1,062 
1,249 
1,379 
1,292 
1,267 
1,064 
950 
935 
880 
1,047 
549 
1,216 

42 

49 

54 

51 

50 

42 

37 

37. 

35 

41 

22 

48 

25,474 

1,000 

La  division  du  temps  d'après  laquelle  la  série  est  con- 
struite s'appelle  l'échelle  de  la  série.  Cette  façon  de  pré- 
senter les  résultats  statistiques  est  simple  et  commode.  A  la 
condition  d'adopter  une  division  appropriée  à  la  recherche 
scientifique  qu'on  se  propose,  ce  système  présente  le  grand 


(1)  Enrico  Raseei,  «  Les  naissances  et  les  décès  suivant  les  heures  de  la 
journée  »  [Bulletin  de  l'Institut  international  de  statistique,  t.  XI,  livre  I, 
p.  144). 
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avantage  de  n'être  pas  arbitraire,  qualité  qui  ne  se  retrouve 
pas  toujours  dans  le  second  mode  de  présentation. 

191.  Dans  le  second  groupe  nous  rangeons  les  séries 
dans  lesquelles  les  unités  sont  réparties  d'après  leur  situa- 
tion dans  l'espace.  La  présentation  par  unité  géographique 
offre  naturellement  moins  de  précision  que  celle  basée  sur 
les  divisions  du  temps,  parce  que  le  choix  du  statisticien 
peut  se  porter  à  peu  près  indifféremment  sur  telle  unité 
ou  sur  telle  autre.  L'ordre  du  classement  n'échappe  pas 
non  plus  à  tout  arbitraire.  Il  peut  être  basé  sur  la  succes- 
sion naturelle  des  nombres  ou  sur  leur  importance  propor- 
tionnelle dans  certaines  divisions  territoriales;  une  étude 
attentive  de  ces  séries  est  la  première  condition  à  réaliser 
pour  la  confection  des  cartogrammes.  Les  comparaisons 
statistiques  portant  sur  des  époques  différentes  doivent 
être,  en  outre,  surveillées  de  près;  il  arrive  fréquemment 
que  la  composition  des  unités  territoriales  se  soit  modifiée 
dans  l'intervalle  :  une  commune  urbaine  a,  par  exemple, 
annexé  à  son  territoire  des  communes  rurales  proches,  etc. 

A  côté  de  cet  inconvénient,  les  séries  disposées  d'après 
les  divisions  de  l'espace  présentent  un  avantage  :  c'est  de 
se  prêter  à  de  nombreuses  combinaisons.  On  peut  énumérer 
les  provinces  d'un  pays  en  suivant  l'ordre  alphabétique, 
ou  en  les  classant  d'après  leur  situation  géographique  (pro- 
vinces du  nord,  du  sud,  de  l'est,  etc.),  ou  suivant  l'impor- 
tance de  leur  population,  ou  encore  d'après  tel  caractère 
économique  (provinces  industrielles,  agricoles).  En  recou- 
rant simultanément  à  plusieurs  de  ces  critères,  on  multi- 
plie et  on  précise  en  même  temps  les  aspects  sous  lesquels 
les  phénomènes  peuvent  être  envisagés.  Même  dans  les  cas 
les  plus  simples,  cette  présentation  double  ou  triple  pré- 
sente des  avantages.  Le  rapport,  pour  mille,  de  la  popula- 
tion industrielle  dans  chaque  province  belge  à  la  population 
totale  a  été  établi  de  la  sorte  par  le  recensement  de  l'indus- 
trie et  du  commerce  (1910)  : 
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Exemple  5.  —  Proportion  (pour  mille)  de  la  population  industrielle 
à  la  population  totale  dans  les  provinces  ci-dessous  : 


Les  deux  sexes  réunis 

Les  hommes 

Les  femmes 

286 

Hainaut  .... 

492 

Flandre  Orientale  .  . 

174 

279 

Liège  

466 

Flandre  Occidentale  . 

172 

Flandre  Orientale    .  . 

237 

Anvers .    .   .   ,  . 

351 

99 

Flandre  Occidentale .  . 

229 

347 

94 

213 

Brabant  .... 

333 

75 

210 

Flandre  Orientale  . 

301 

71 

196 

Flandre  Occidentale 

288 

48 

Luxembourg  .... 

121 

Luxembourg .    .  . 

205 

Luxembourg    .    .  . 

33 

102 

Limbourg  .... 

170 

Limbourg    .    .    .  . 

33 

192.  Le  troisième  groupe  est  formé  par  les  séries  qui  ne 
sont  basées  ni  sur  la  succession  chronologique,  ni  sur  la  ré- 
partition dans  l'espace.  Au  lieu  de  considérer  la  répétition 
d'un  phénomène  dans  le  temps,  ou  les  aspects  divers  de  ses 
manifestations  à  des  endroits  différents,  nous  pouvons 
étudier  les  faits  en  eux-mêmes,  à  un  moment  donné.  Les 
unités  qui  composent  ces  séries  sont  de  grandeurs  diverses, 
mais  elles  présentent  toutes  un  caractère  spécial  permet- 
tant de  les  grouper  et  de  les  considérer  dans  leur  ensemble. 
Le  salaire  d'un  manœuvre  est  quelque  chose  de  différent 
du  salaire  de  l'ouvrier  qualifié;  mais,  dans  une  même  pro- 
fession, il  y  a  une  masse  de  salaires  bas,  moyens-,  élevés, 
dont  l'ensemble  caractérise  le  salaire  de  la  profession.  On 
voit  que  cette  troisième  espèce  de  séries  est  très-  différente 
des  deux  premières.  Elle  embrasse  des  cas  nombreux  -.qu'il 
s'agisse  de  la  répartition  des  revenus,  de  la  grandeur  des 
hommes-  adultes,  ou  de  la  distribution  des  âges  parmi  une 
population,  c'est  dans  le  troisième  groupe  que  rentrent  les 
séries  constituées  à  l'aide  de  ces  nombres.  D'ordinaire,  les 
divisions  de  ces  séries  dépendent  de  la  nature  des  unités 
elles-mêmes;  il  peut  arriver  aussi  que  les  divisions  soient 
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déterminées  par  la  précision  avec  laquelle  les  observations 
des  cas  individuels  ont  été  faites.  Les  statisticiens  anglais 
donnent  le  nom  de  «  discrète  séries  »  aux  séries  citées  en 
premier  lieu,  tandis-  qu'ils  appellent  «  continuons  séries  » 
les  secondes. 

La  distribution  des  salaires  parmi  une  population  ou- 
vrière fournira  un  bon  exemple  des  séries  que  nous  envisa- 
geons ici  : 

Exemple  6. 

Salaire  d'une  journée  de  travail  pour  les  hommes  de  plus  de  16  ans 
appartenant  aux  industries  des  métaux. 

(Salaires  et  durée  du  travail  dans  les  industries  des  métaux  au  31  octobre  1903). 
Publication  de  l'Office  du  Travail  de  Belgique,  Analyse,  p.  9. 


Taux  du  salaire 

Nombre  d'ouvriers 

Taux  du  salaire 

NOMBR  E 

d'ouvribks 

Francs 

Nombre 

0/ 

Francs 

Nombre 

°/o 

absolu 

absolu 

Moins  de  1.50 . 

978 

1.16 

De  4.25  à  4  49  . 

4,545 

5.40 

De  1.50  à  1.74.  . 

1,495 

1.78 

De  4.50  à  4.74  . 

5,413 

6.43 

De  1.75  à  1.99.  . 

1,442 

1.71 

De  4.75  à  4.99  . 

3,031 

3.60 

De  2.00  à  2  24.  . 

2,699 

3.21 

De  5.00  à  5.24  . 

4,153 

4.94 

De  2.25  à  2  49.  . 

2,263 

2.69 

De  5.25  à  5.49  . 

1,706 

2.03 

De  2.50  à  2.74.  . 

4,407 

5.24 

De  5.50  à  5.74  . 

2,081 

2.47 

De  2.75  â  2.99.  . 

4,926 

5.85 

De  5  75  à  5  99  . 

1,036 

1.23 

De  3.00  à  3.24.  . 

9,048 

10.75 

De  6.00  à  6.24  . 

1,367 

1.63 

De  3  25  à  3.49.  . 

7,079 

8.42 

De  6.25  à  6.49  . 

571 

0.68 

De  3.50  à  3.74.  . 

8,657 

10.29 

De  6.50  à  6.74  . 

644 

;0  77 

De  3.75  à  3  99.  . 

6,575 

7.82 

De  6.75  à  6.99  . 

323 

0.38 

De  4.00  à  4.24.  . 

8,071 

9.59 

7. 00 et  plus    .  . 

1,626 

1.93 

Total.    .  . 

84,136 

100.00 

193.  Plusieurs  statisticiens  ont  proposé  un  mode  de  clas- 
sification différent,  qui  serait  emprunté  à  l'allure  des  nom- 
bres inclus  dans  la  série,  selon  la  tendance  stationnaire,  as- 
cendante ou  descendante  qu'ils  manifestent.  Sans  doute, 
aucun  phénomène  collectif  n'est  absolument  stable;  ses 
unités,  essentiellement  variables,  impriment  à  la  masse  une 
agitation  incessante,  mais  ces  changements  ont  une  direc- 
tion marquée  qui  se  peut  caractériser. 
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Si  les  nombres  compris  dans  une  série  présentent  cette 
marque  d'une  stabilité  relative,  on  dira  de  cette  série 
qu'elle  revêt  un  caractère  constant;  peu  importe  que  les 
écarts  entre  les  données  soient  presque  insignifiants,  ou 
que,  après  quelque  brusque  déviation,  les  données  re- 
viennent au  niveau  antérieur,  comme  orientées  vers  une 
moyenne. 

La  répartition  proportionnelle,  suivant  l'âge  et  suivant 
l'état  de  famille,  aux  divers  recensements-,  fournit  un 
exemple  de  séries  constantes  ;  la  régularité  est  plus  grande 
en  ce  qui  concerne  la  répartition  suivant  l'âge,  mais  celle 
que  présente  la  répartition  selon  l'état  civil  est  encore  suf- 
fisante pour  la  faire  rentrer  dans  la  catégorie  des  séries 
stables.  Pour  ne  pas  alourdir  le  tableau,  nous  ne  donnons  r 
les  chiffres  que  pour  certaines  catégories  d'âges  : 


Exemple  7. 

France  (1).  Répartition  proportionnelle  suivant  l'âge  et  l'état  civil 
aux  divers  recensements. 


ANNÉES 

DES 

RECENSEMENTS 

Série  constante 
statique 

SÉRIE  CONSTANTE 
STATIQUE 

SÉRIE  CONSTANTE 
IRRÉGULIÈRE 

Population  présente 
de  40  à  59  ans 

Population  présente 
mariée 

Veufs-ves. 
_  divorcés-cées 

de  (0  ans 
et  plus 

de  50  ans 
et  plus 

de 

18  à  59  ans 

de 

15  à  49  ans 

Hommes 
P.  c. 

Femmes 
P.  c. 

Hommes 
P.  c. 

Femmes 
P.  c. 

Hommes 
P.  e. 

Femmes 
P.  c. 

1851  

22.59 

22  69 

64.71 

53  55 

3.60 

4  07 

1856   

23.12 

22  58 

64  15 

53  88 

3.99 

4.61 

1861  

22  87 

22.58 

64.87 

54  22 

3  75 

4  34 

1866   

22.90 

22  78 

64  56 

54.25 

3.78 

4.47 

1872    ....  . 

23  04 

22.89 

63.09 

53  81 

4  26 

5.72 

1876   

22  68 

22.79  ' 

63  96 

53.12 

3  95 

5.43 

1881  

22.58 

22  74 

63.48 

53.12 

3  97 

4  83 

1886   

22.27 

22  25 

63.78 

53  45 

4  01 

5  08 

1891  

22  39 

22  45 

64.22 

52  39 

4.16 

5  11 

1896   

22.31 

22.34 

64.33 

51  32 

4  03 

5.08 

1901    .  . 

22.44 

22.65 

64  40 

48.42 

373 

5  21 

(1)  Données  extraites  de  1 
rétrospective,  pp.  12-13. 


'Annuaire 


statistique  de  la  l< 


'ranee,  1911,  partie 
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194.  L'appellation  de  «  série  dynamique  régulière  »  est 
réservée  aux  séries  où  se  manifeste  une  tendance  à  la  modi- 
fication d'un  état  de  choses  antérieur,  tendance  constante 
agissant  avec  une  régularité  plus  ou  moins  complète,  mais 
d'une  façon  continue.  Ces  séries  peuvent  se  composer  de 
nombres  disposés  en  ordre  croissant  et  alors  on  les  appelle 
séries  dynamiques  à  ordre  croissant,  ou  l'inverse  se  pro- 
duit et  dans  ce  cas  on  leur  donne  le  nom  de  séries  dyna- 
miques décroissantes.  Un  grand  nombre  de  phénomènes 
économiques  se  marquent  sous  la  forme  de  séries  dyna- 
miques croissantes. 

Exemple  8. 


Série  dynamique 
croissante 

Série  dynamique 
décroissante 

Série  dynamique 
croissante 

Série  dynamique 
dcéroissante 

ANNÉES 

BELGIQUE 

Moteurs 
à  vapeur, 
force  eu  HP. 

ANNÉES 

BELGIQUE 

Proportiou 
des  miliciens 
ne  sachant 

ni  lire, 
ni  écrire. 

us 

Eâ' 

td 

Z 

z 

BELGIQUE 

Moteurs 
à  vapeur, 
force  eu  HP. 

ce 

« 
Z 

z 
< 

BELGIQUE 

Proportion 
des  miliciens 
ne  sachant 

ui  lire, 
ni  écrire. 

1885 

781,755 

1876 

18.41 

1897 

1,208,479 

1888 

13.29 

.  1886 

793,924 

1877 

19.97 

1898 

1,249,813 

1889 

13  13 

1887 

812,980 

878 

18.62 

1899 

1,312,319 

1890 

13.05 

1888 

821,988 

1879 

18  81 

1900 

1,388,941 

1891 

13  29 

1889 

859,412 

1880 

17.49 

1901 

1,554,157 

1892 

12.60 

1890 

903,833 

1881 

15.99 

1902 

1,639,606 

1893 

12  73 

1891 

936,846 

1882 

15.87 

1903 

1,713,684 

1894 

12  26 

1892 

993,307 

1883 

15.38 

1904 

1,825,634 

1895 

11.54 

1893 

1,032,492 

1884 

15.59 

1905 

1,946,496 

1896 

11.41 

1894 

1,062,876 

1885 

14.64 

1906 

2,064,566 

1897 

10  91 

1895 

1,090,922 

1886 

14.11 

1907 

2,210,147 

1898 

10  89 

1896 

1,127,468 

1887 

13  87 

1908 

2,348,493 

1899 

10  87 

195.  On  donne  le  nom  de  <(  séries  dynamiques  irrégu- 
lières »  à  celles  où  se  manifeste  un  mouvement  alternatif 
d'avance  et  de  recul,  comme  il  arrive  dans  les  séries  rela- 
tives à  des  phénomènes  qui  traduisent  l'état  des  relations 
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économiques.  Ces  séries  peuvent  être  constituées  de  nombres 
exprimant  les  caractères  de  variabilité  d'un  phénomène 
unique,  ou  de  nombres  résultant  de  calculs  ayant  pour  objet 
une  pluralité  de  phénomènes  ;  on  peut  encore  distinguer  les 
séries  dynamiques  périodiques  dans  lesquelles  se  marque 
une  tendance  à  la  répétition  des  mêmes  nombres  aux  mêmes 
époques. 

Exemple  9. 


SÉRIES  DYNAMIQUES 
IRRËGULIÈRES 


SÉRIES  DYNAMIQUES  PÉRIODIQUES 


BELGIQUE 


BELGIQUE 


BELGIQUE 


Exportations  (Valeur 
du  commerce  spécial) 

■1 

Nombre  de  grèves 

1 

Heures  de  soleil  à  Uccle 
18S6-1912 

Jours 
sans  soleil 

Années 

Milliers 
de  frs. 

Années 

Nombres 
absolus  | 

Mois 

Etat 
possible 

Total  observé 

Nombre 
moyen 

Moyen  |    1*.  c. 

1896 

1,468 

1896 

139 

Janvier.    .  . 

263 

60 

23 

13.1 

1897 

1,626 

1897 

130 

Février.    .  . 

280 

82 

29 

8.6 

1898 

1,787 

1898 

91 

Mars    .    .  . 

368 

123 

33 

5.1 

1899 

1,949 

1899 

104 

Avril    .    .  . 

415 

176 

42 

2.3 

1900 

1.923 

1900 

146 

Mai  .... 

481 

222 

46 

1  6 

1901 

1,828 

1901 

117 

Juin  .... 

493 

207 

42 

1.7 

1902 

1,925 

1902 

73 

Juillet  .    .  . 

496 

226 

46 

1.1 

1903 

2,110 

1903 

70 

Août.    .    .  . 

450 

216 

48 

0.9 

1904 

2,183 

1904 

81 

Septembre 

379 

169 

45 

2.0 

1905 

2,334 

1905 

133 

Octobre    .  . 

332 

123 

37 

4.9 

1906 

2,794 

1906 

207 

Novembre.  . 

270 

69 

26 

10  2 

1907 

2,848 

1907 

221 

Décembre .  . 

247 

53 

21 

12.8 

1908 

2,506 

1908 

101 

1909 
1910 

2,810 

1909 

119 
108 

Année  .    .  . 

4,474 

1,726 

39 

64  3 

3,407 

1910 

1911 

3,580 

1911 

156 

1912 

3,951 

1912 

202 
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II.  —  Sériation. 

196.  On  appelle  sériation  l'opération  par  laquelle  une 
masse  de  données  résultant  du  calcul  se  trouve  divisée  en 
sections  de  manière  à  faire  apparaître  le  nombre  de  cas 
rentrant  dans  chacune  d'elles.  La  sériation  a  pour  but 
principal  d'aider  à  discerner  les  caractères  essentiels  des 
données  statistiques  en  vue  de  tirer  les  conclusions  scienti- 
fiques qui  se  dégagent  des  faits  observés. 

Chaque  section  opérée  dans  la  série  prend  le  nom  de 
«  classe  »;  la  «  grandeur  »  de  la  classe  signifie  l'étendue 
de  la  mesure  dont  on  se  sert  à  l'intérieur  de  la  classe;  si 
l'on  observe  la  pression  barométrique  dans  un  endroit  donné 
en  la  notant  par  mm.,  le  millimètre  est  la  grandeur  de  la 
classe.  On  donne  le  nom  de  <(  fréquence  »  à  la  quantité  des 
cas  observés  appartenant  à  une  classe  donnée;  l'ensemble 
des  cas,  répartis  entre  les  diverses  classes,  et  envisagés 
sous  le  rapport  de  leur  répartition,  est  désigné  sous  le  nom 
de  «  distribution  des  fréquences  ».  Le  «  module  »,  selon  la 
terminologie  de  certains  auteurs,  désigne  la  différence 
quantitative  entre  les  termes  extrêmes  de  la  grandeur  de 
deux  classes  successives  (Bosco)  ;  dans  une  division  de  la 
population  par  âge,  on  commence  parfois  par  énumérer 
cette  population  par  mois  pour  la  première  année  de  vie, 
puis  par  année  jusqu'à  la  cinquième  année  de  vie,  puis  par 
cinq  ans  au  delà,  sauf  à  revenir  à  l'année  pour  les  cas 
extrêmes  de  vieillesse  ;  le  module  est  successivement  le  mois, 
l'année,  le  lustre,  et  l'année.  Toutefois,  cette  expression  dé- 
signe, d'après  la  terminologie  d'autres  auteurs  (Airy),  la 
déviation-type  (voir  ch.  III)  multipliée  par  la  racine  carrée 
de  2  (1.4142136)  (1).  Pour  éviter  toute  confusion,  il  est  pré- 
férable de  ne  pas  employer,  dans  la  terminologie  relative 


(1)  U.  G.  Yule  :  «  An  introduction  to  the  theory  of  statistics  »,  p.  144. 
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à  la  sériation,  l'expression  «  module  »  dans  le  sens  indiqué 
en  premier  lieu. 

197.  Le  statisticien,  en  opérant  la  sériation  des  données 
fournies  par  le  dépouillement,  doit  avoir  en  vue,  d'une  part, 
le  but  particulier  qu'il  se  propose  et,  d'autre  part,  la  nature 
intrinsèque  du  matériel  qu'il  met  en  œuvre. 

La  sériation  étant  un  procédé  d'analyse,  sa  formation 
doit  toujours  rester  subordonnée  au  but  que  le  statisticien 
se  propose  dans  la  recherche  particulière  qu'il  entreprend; 
aussi  plusieurs  séiïations  différentes  peuvent  s'effectuer 
parmi  les  données  statistiques  en  vue  de  faire  apparaître 
différents  caractères  qu'elles  possèdent.  Quelques  exemples 
sont  ici  nécessaires. 

La  population  d'un  pays,  à  chaque  recensement,  est 
présentée  commune  par  commune;  l'ensemble  de  ces  don- 
nées peut  faire  l'objet  d'une  sériation  particulière  en  vue  de 
reconnaître  si  une  tendance  se  marque  à  la  concentration 
dans  les  grandes  villes.  Pour  trouver  la  solution  d'un  pro- 
blème de  ce  genre,  on  peut  avoir  recours  à  une  sériation 
d'après  laquelle  les  communes  du  pays  sont  réparties  en 
un  certain  nombre  de  catégories  d'après  leur  population. 
Voici  un  tableau  de  ce  genre  relatif  à  la  Belgique,  d'après 
les  données  des  neuf  recensements  généraux  effectués 
dans  ce  pays;  les  données  concernant  l'année  1912  pro- 
viennent du  relevé  de  la  population  d'après  les  registres 
de  population;  elles  sont  moins  sûres  que  les  suivantes,  à 
raison  des  doubles  emplois. 
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Pour  étudier  la  distribution  des  salaires  dans  une  popu- 
lation ouvrière  homogène,  il  faut  opérer  la  sériation  des  sa- 
laires en  adoptant  une  certaine  grandeur,  soit  une  division 
par  franc  si  l'on  se  borne  à  des-  chiffres  approximatifs,  soit 
une  division  plus  précise  par  cinquante  ou  vingt-cinq  cen- 
times. 


Exemple  11.  —  Salaires  des  hommes  de  plus  de  16  ans 
(Belgique,  industries  des  métaux,  octobre  1903). 


NOMBRE  DES  OUVRIERS 

TAUX 

nRS  SALAIRES 

Sériation 

Sériation 

Sériation 

CL 

b 

c 

Total 

o*±,  1  ou 

84,136 

Olj  1  ou 

Fr. 

1.50 

978 

(978) 

(.978) 

1  50  à  1.74 

1,495  | 

2,937 

(1,495)  . 

1.75  à  1.99 

1,442  \ 

j  4,141 

2.00  à  2.24 

2,699  ) 

4,962 

2.25  à  2.49 

2,263  ) 

j  6,670 

2.50  à  2.74 

4.407  j 

9,333 

2.75  à  2.99 

4,926  | 

13,974 

3.00  à  3.24 

9,048  1 

1 6 , 1 27 

3  25  à  3.49 

7,079  j 

j  15,736 

3  50  a  3.74 

8,657  ) 

15,232 

3.75  à  3.99 

6,575  j 

|  14,646 

4.00  à  4  24 

8,071  j 

12,616 

4.25  à  4.49 

4,545  J 

j  9,958 

4  50  à  4.74 

5,413  ) 

8,444 

4.75  à  4.99 

3,031  j 

j  7,184 

5.00  à  5.24 

4,153  ) 

5,859 

5.25  à  5.49 

1,706  j 

|  3,787 

5.50  à  5  74 

2,081 

3,117 

5  75  â  5.99 

1,036  j 

j  2,403 

6.00  à  6  24 

1,367  i 

1,938 

6  25  à  6.49 

571  i 

j  1,215 

6.50  à  6.74 

644  ) 

967 

6.75  à  6.99 

323  j 

(323) 

7  00  et  plus 

1,626 

(1,626) 

(1,626) 
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La  sériation  a  montre  que  la  distribution  des  salaires  à 
une  échelle  correspondant  au  quart  du  franc  a  une  allure 
irrégulière  :  sauf  dans  un  cas,  le  nombre  des  ouvriers  ga- 
gnant un  salaire  compris  entre  le  point  du  franc  et  le  se- 
cond échelon,  ou  entre  le  point  du  demi-franc  et  le  qua- 
trième échelon,  est  plus  important  que  le  nombre  des  ou- 
vriers payés  aux  autres  taux;  l'équilibre  se  rétablit,  et  la 
série  redevient  régulière  si  l'on  constitue  des  groupements 
de  cinquante  en  cinquante  centimes. 

Lorsque  la  sériation  est  faite  d'après  des  divisions 
étroites,  correspondant  aux  limites  entre  lesquelles  les 
faits  sont  observés,  il  arrive  fréquemment  que  la  série  se 
présente  sous  une  forme  irrégulière,  c'est-à-dire  que  les 
nombres  se  succèdent  dans  un  ordre  tantôt  croissant,  tan- 
tôt décroissant,  au  lieu  d'augmenter  d'une  manière  con- 
stante vers  un  maximum  et  de  redescendre  ensuite  vers  un 
minimum;  on  obvie  à  cet  inconvénient  en  opérant  un  nou- 
veau classement  en  partant  du  premier  stade,  puis  du  se- 
cond et  en  comprenant  dans  une  même  division  deux,  et 
puis  trois  des  divisions  primitives.  L 'exemple  précédent,  em- 
prunté à  la  statistique  des  salaires  dans  les  industries  des 
métaux,  en  Belgique  (octobre  1903),  montre  d'une  façon 
très  claire  le  procédé  à  employer;  nous  le  retrouverons 
plus  loin  en  parlant  de  la  façon  empirique  de  rechercher  la 
dominante. 

198.  La  sériation  par  pour  cent,  au  lieu  d'utiliser  les 
nombres  absolus,  peut  aussi  être  employée  et  souvent  elle 
donne  des  résultats  plus  instructifs  que  le  simple  groupe- 
ment des  données  primaires.  On  peut  calculer  les  pour  cent 
en  rapportant  chaque  partie  à  la  masse,  comme  dans 
l'exemple  suivant  emprunté  au  tableau  relatif  à  la  réparti- 
tion de  la  population  belge  dans  les  communes  classées 
d'après  leur  grandeur  : 
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Exemple  12. 


Proportion 
du  nombre 
de  communes. 


1910  l 


COMMUNES  DE 

100,000  habitants  et  plus   0.15 

50,000  à  100,000 -habitants   0.30 

25,000  à  50,000  habitants   0.76 

20,000  à  25,000  habitants   0.34 

15,000  à  20,000  habitants   0.79 

10,000  à  15,000  habitants   1.78 

5,000  à  10,000  habitants   6.84 

3,000  à     5,000  habitants   9.00 

2,000  à    3,000  habitants   10.10 

1,000  à    2,000  habitants  .....  26.14 

500  à    1,000  habitants   26.13 

300  à       500  habitants   11.07 

Moins  de  300  habitants   6.00 

On  peut  aussi  rapporter  les  données  primaires  à  une 
autre  donnée  plus  générale  avec  laquelle  elles  accusent  un 
rapport  de  dépendance,  la  population,  par  exemple,  comme 
dans  le  tableau  ci-après  où  la  population  active  appartenant 
à  l'industrie  du  vêtement  est  classée  par  province,  en  raison 
de  la  proportion  par  1,000  habitants  dans  la  province. 

Exemple  13. 

BELGIQUE  :  Recensement  de  l'industrie  et  du  commerce,  1910 

Brabant  45.2  p.  m.  de  la  population 

Liège  28.9  p.  m.  de  la  population 

.  23.5  p.  m.  de  la  population 
.  23.3  p.  m.  de  la  population 
.  22.4  p.  m.  de  la  population 
.  21.7  p.  m.  de  la  population 
.  20.4  p.  m.  de  la  population 
.  20.2  p.  m.  de  la  population 
.  15.5  p.  m.  de  la  population 
27  5  p.  m.  de  la  population 


Anvers  .... 
Flandre  Orientale  . 
Hainaut  .... 
Flandre  Occidentale 
Limbourg  .  .  . 
Namur  .... 
Luxembourg  .  . 
Le  Royaume    .  . 


199.  Nous  avons  parlé,  dans  le  chapitre  consacré  au  dé- 
pouillement, de  la  grandeur  des  classes  et  du  point  de  départ 
à  adopter  dans  l'échelle  du  classement.  (Cfr.  nos  149  et  155.) 
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Ces  observations  s'appliquent  également  à  la  sériation. 
Celle-ci  est  d'ailleurs  intimement  liée  au  dépouillement  en 
ce  sens  que  les  divisions  de  classes  ne  peuvent  comporter- 
une  précision  plus  grande  que  celle  admise  pour  le  dépouil- 
lement lui-même.  Si  les  salaires  d'un  groupe  d'ouvriers  ont 
été  relevés  et  dépouillés  en  tenant  compte  seulement  des  di- 
visions de  cinquante  en  cinquante  centimes,  la  sériation  ne 
peut  prétendre  atteindre  une  plus  grande  précision,  mais 
elle  peut  se  faire  en  adoptant  des  bases  plus  larges,  par 
exemple  le  franc  au  lieu  de  cinquante  centimes.  Cette  façon 
de  procéder  est  souvent  utile,  comme  nous  l'avons  dit,  en 
vue  de  faire  disparaître  des  séries  les  inégalités  acciden- 
telles qui  s'y  remarquent  et  ainsi  de  mettre  l'observateur 
sur  la  voie  des  tendances  réelles  qui  se  manifestent  clans  les 
groupes. 

III.  —  Distribution  des  fréquences. 

200.  Après  avoir  disposé  les  séries,  il  est  tout  naturel 
d'examiner  si  la  succession  de  leurs  données  obéit  à  une 
direction  quelconque,  si  les  a  fréquences  »  augmentent  ou 
diminuent  progressivement  ou  si,  après  avoir  suivi  un  mou- 
vement ascensionnel,  elles  prennent  ensuite  une  direction 
régressive.  Cette  étude  paraît  intimement  liée  à  l'analyse 
des  données  statistiques.  Supposons  que  l'on  ait  les  chiffres 
de  deux  séries  statistiques,  concernant  deux  pays  diffé- 
rents, mais  relatives  à  la  même  période  de  temps;  n'est-il 
pas  nécessaire  à  l'étude  comparative  qu'on  veut  faire,  de 
déterminer  la  direction  de  chacune  de  ces  séries,  le  point  où 
se  manifeste  un  mouvement  ascensionnel,  la  hauteur 
atteinte  par  ce  mouvement,  le  degré  où  se  marque  l'arrêt 
et  où  commence  la  régression  ?  Tous  les  lecteurs  de  statis- 
tiques se  trouvent  placés  devant  semblable  problème  ;  ils  en 
cherchent  la  solution  par  des  moyens  plus  ou  moins  simples, 
plus  ou  moins  exacts.  Or,  il  existe  des  procédés  pour  étudier 
et  classer  les  courbes  dessinées  par  les  séries.  C'est  à 
l'exposé  sommaire  de  cette  matière,  illustrée  par  quelques 
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données  numériques  et  graphiques,  qu'est  consacré  le  pré- 
sent paragraphe. 

201.  Pour  analyser  une  série  sous  le  rapport  de  la  distri- 
bution de  ses  fréquences,  il  est  souvent  utile  de  déterminer 
graphiquement  son  développement.  Dans  ce  but,  on  trace 
une  première  ligne  horizontale,  sur  laquelle  on  porte,  à 
intervalles  égaux,  les  divisions  des  différentes  classes  dont 
se  compose  la  série.  Pour  plus  de  facilité,  on  emploie  du 
papier  quadrillé  ordinaire  ou,  ce  qui  est  préférable  mais 
plus  coûteux,  du  papier  millimétrique,  avec  les  divisions 
de  centimètre  en  centimètre  plus  marquées  que  les  autres. 
On  arrête,  d'une  façon  arbitraire,  la  largeur  à  attribuer  à 
chaque  intervalle,  par  exemple  2  1/2  centimètres.  Vers  la 
gauche  de  cette  ligne  horizontale,  on  trace  une  seconde 
ligne,  mais  dans  le  sens  vertical,  recoupant  la  première  à 
angle  droit,  de  telle  façon  que  le  point  de  rencontre  des 
deux  droites  soit  l'origine  ou  point  de  départ  du  premier 
intervalle.  Sur  la  ligne  verticale  on  porte  les  divisions  par 
fréquence  en  commençant  par  la  plus  basse  et  en  finissant 
par  la  plus  élevée;  bien  entendu,  les  intervalles  sur 
l'échelle  des  fréquences  sont  proportionnels  aux  écarts 
des  fréquences  elles-mêmes.  Pour  chaque  classe,  on  note 
alors,  d'après  l'échelle  des  fréquences,  la  hauteur  corres- 
pondant à  la  fréquence  de  la  classe. 

Deux  procédés  s'offrent  alors  pour  parfaire  le  gra- 
phique :  relier  par  une  suite  de  droites,  formant  une  ligne 
brisée,  les  différents  points  déterminés  comme  ci-dessus.  Si 
l 'on  adopte  ce  système,  on  doit  indiquer  le  point  de  hauteur 
dans  l'axe  vertical  du  milieu  de  l'intervalle  de  la  classe, 
commencer  le  tracé  graphique  à  l'origine  de  l'intervalle,  le 
faire  passer  par  le  point  déterminé  et  de  là  le  diriger  sur 
le  point  indiquant  la  hauteur  de  la  seconde  classe,  etc.  On 
obtient  alors  ce  qui  s'appelle  le  polygone  de  fréquence  de 
la  série.  Le  second  système  consiste  à  élever,  sur  chaque 
intervalle  des  classes  un  rectangle  ayant  cet  intervalle 
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comme  base  et  dont  la  hauteur  est  proportionnelle  à  la  fré- 
quence de  la  classe  :  le  professeur  Pearson  a  donné  à  ces 
figures  le  nom  de  histogramme.  Les  deux  figures  sont 
représentatives,  mais  sous  le  rapport  de  l'exactitude  le 
polygone  de  fréquence  laisse  quelque  chose  à  désirer  : 
veut-on  mesurer  l'aire  de  la  figure,  le  polygone  ne  le  permet 
qu'à  la  condition  qu'il  y  ait  compensation  entre  les  angles 
formés  par  dessus  et  par  dessous  la  ligne  brisée,  ce  qui  pra- 
tiquement ne  se  réalise  que  rarement.  Aussi  est-il  préfé- 
rable de  recourir  à  l'emploi  de  l'histogramme;  cette  figure 
permet  de  mesurer  exactement  l'aire  du  phénomène  exprimé 
au  moyen  de  la  série.  Cependant,  lorsqu'il  s'agit  de  figures 
comparatives,  le  choix  doit  être  donné  au  polygone  de  fré- 
quence; les  lignes  superposées  dans  l'histogramme  double 
servant  à  une  comparaison  sont  embrouillées  et  bien  moins 
parlantes  que  les  courbes  plus  ou  moins  élancées  ou  plus 
ou  moins  aplaties  des  polygones  comparatifs  (1). 

202.  Une  première  hypothèse  semble  surgir  naturelle- 
ment quand  on  en  vient  à  rechercher  la  forme  de  la  courbe 
décrite  par  les  données  relatives  à  certains  phénomènes 
statistiques  :  pourquoi  cette  courbe  ne  ressemblerait-elle 
pas  à  la  courbe  normale  des  erreurs,  à  la  courbe  de  Gauss, 
ou  à  la  courbe  que  Quetelet  a  popularisée,  au  moins  parmi 
les  statisticiens,  sous  la  dénomination  de  courbe  binomiale? 
Nous  n'avons  pas  dit  que  la  loi  de  distribution  serait 
la  même,  identique  à  la  loi  dé  Gauss,  mais  seulement  qu'elle 
pourrait  y  ressembler,  car,  en  général,  il  est  avéré  que  la  loi 
de  la  distribution  normale  des  erreurs  n'est  fondée  que 
pour  les  mesures  provenant  d'observations  répétées  d'un 
même  objet  (2). 


(1)  Voir  l'exposé  de  la  statistique  graphique,  livre  II,  chap.  V. 

(2)  Il  n'est  pas  inutile  d'insister  sur  ce  point  de  vue,  car  de  vives  contro- 
verses se  sont  élevées  à  ce  sujet.  Il  y  a  quelque  vingt  ans,  le  professeur  Pear- 
son a  critiqué  avec  vivacité  ceux  de  ses  prédécesseurs  qui  avaient  établi,  selon 
lui,  une  analogie  trop  étroite  entre  la  loi  des  erreurs  accidentelles  et  la 
distribution  des  faits  statistiques.  La  formule  de  la  loi  des  erreurs  donne 
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Lorsque  la  loi  définie  par  Gauss,  et  qui  originairement 
avait  été  trouvée  par  Laplace,  fut  reconnue  et  appliquée, 
on  la  trouva  exacte  pour  les  mesures  différentes  prises  sur 
un  même  objet  :  ces  mesures  différentes  s'appliquaient 
à  des  matières  qui  sont  le  sujet  ordinaire  des  observations 
dans  les  sciences  astronomiques,  physiques,  anthropolo- 
giques, etc.  S 'agit-il,  comme  dans  les  statistiques,  non  plus 
d'un  objet,  mais  d'une  série  d'objets  différents  quoique 
homogènes,  la  forme  de  la  distribution  semble  être,  en 
général,  asymétrique  autour  de  la  moyenne.  Ceci  n'empêche 
pas  qu'une  ressemblance  pourrait  exister  et  qu'il  y  a  un 
très  grand  intérêt  à  la  rechercher  et  à  la  déterminer. 

Il  n'entre  pas  dans  notre  plan  de  discuter  à  cette  place 
la  loi  des  erreurs  accidentelles  dont  on  trouvera  un  exposé 
au  livre  III;  mais  il  est  cependant  impossible  de  résumer 
d'une  manière  intelligible  ce  qui  a  trait  à  la  distribution 
des.  fréquences  sans  faire  précéder  ces  indications  de  quel- 
ques notions  préliminaires  sur  la  loi  des  erreurs. 

D'après  Gauss,  la  loi  des  erreurs,  qui  est  traduite  graphi- 
quement par  la  courbe  normale  des  erreurs  ou  courbe  nor- 
male des  fréquences,  exprime  la  probabilité  comparative 
de&  erreurs  de  différente  grandeur.  Le  raisonnement, 
autant  que  l'expérience,  nous  avertissent  suffisamment  de 
ce  que,  lorsqu'un  observateur  n'est  guidé  par  aucun  parti 
pris  et  qu'il  désire  réellement  observer  ce  qui  est  placé 
sous  ses  yeux  (animus  observandi),  les  erreurs  les  plus  con- 
sidérables sont  aussi  les  moins  nombreuses,  tandis  qu'il  y  a 
des  chances  pour  que  les-  petites  erreurs  soient  beaucoup 
plus  fréquentes.  Un  second  principe  démontré  par  Gauss  est 
que  les  erreurs  positives,  c'est-à-dire  en  trop,  et  les  erreurs 


naissance  à  une  courbe  qui,  en  fait,  est  éloignée  de  la  distribution  des  phéno- 
mènes considérés  en  statistique;  les  travaux  du  professeur  Pearson  ont  jeté 
sur  la  question  une  vive  lumière.  On  en  trouvera  ci-après  un  aperçu,  néces- 
sairement très  simplifié  et  très  réduit,  car  il  ne  pouvait  être  question  d'aborder 
dans  cet  ouvrage,  qui  s'efforce  d'être  utile  à  tous,  l'appareil  mathématique 
compliqué  dont  les  démonstrations  de  l'espèce  sont  nécessairement  entourées. 
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négatives,  autrement  dites  erreurs  en  moins,  sont  égale- 
ment probables. 

La  démonstration  de  Gauss,  sur  laquelle  nous  n'avons 
pas  à  nous  arrêter  ici,  est  purement  mathématique.  Son 
principe  est  évidemment  juste  ;  cependant,  un  logicien-éco- 
nomiste de  grande  valeur,  Stanley  Jevons,  a  fait  observer 
que  le  fondement  du  raisonnement  de  Gauss  repose,  somme 
toute,  plutôt  sur  une  hypothèse  plausible  que  sur  la  preuve 
d'une  véritable  nécessité,  d'une  loi  au  sens  propre  (1). 

Aussi  le  savant  anglais  fait-il  remarquer  qu'on  peut 
arriver  à  la  même  démonstration  par  une  tout  autre  voie, 
qui  est  celle  à  laquelle  Laplace  et  Quetelet  ont  eu  recours. 
Un  statisticien  autrichien,  M.  le  Dr  Zizek,  caractérise  ainsi 
la  méthode  de  Quetelet:  «  Quetelet  a  trouvé  qu'il  existe  une 
distribution  symétrique  autour  de  la  moyenne,  correspon- 
dant à  la  loi  des  erreurs,  spécialement  dans  les  séries  rela- 
tives à  la  taille  et  à  l'ampleur  de  la  poitrine.  Dans  ses 
recherches,  Quetelet  ne  fait  pas  usage  de  la  loi  de  Gauss, 
mais  de  la  formule  binomiale,  dans  laquelle  les  probabilités 
d'écart  de  la  moyenne  correspondent  aux  coefficients 
d'expansion  binomiale  (2).  »  On  peut  donc  faire  emploi  du 
triangle  arithmétique  pour  déterminer  la  distribution  de  la 
courbe  symétrique,  quand  on  connaît  le  nombre  des  erreurs. 
Ainsi  si  nous  admettons  que  dans  une  recherche  il  y  ait 
six  chances  d'erreur  positive  et  autant  d'erreur  négative, 
nous  consultons  la  treizième  ligne  du  triangle  arithmétique 
et  nous  écrivons,  en  suivant  le  modèle  donné  par  Stanley 
Jevons  (3),  les  résultats  comme  suit  : 


Direction  des  erreurs 

Erreurs  positives 

Erreurs  négatives 

Importance  des  erreurs  .  . 

6,    5,    4,    3,    2,  1 

0 

1,    2,    3,    4,    5,  6 

Nombre  de  chaque  erreur. 

1,  12,  66,  220,  495,  792 

924 

792,  495,  220,  66,  12,  1 

(1)  Stanxey  Jevons,  The  principlcs  of  Science,  p.  378. 

(2)  Zizek,  Statistical  averages.  New- York,  1913,  p.  276. 

(3)  Stanley  Jevons,  loc.  cit.,  p.  379. 
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De  quoi  il  résulte,  comme  le  montre  encore  le  logicien 
anglais,  que  la  probabilité  d'une  erreur  positive  ou  négative 
est  de  792/4096,  fraction  -dans  laquelle  le  numérateur  est 
le  nombre  de  combinaisons  donnant  une  erreur  du  degré  Je 
plus  faible  (on  suppose  connue  la  grandeur  des  erreurs) 
et  le  dénominateur  représente  le  nombre  de  toutes  les 
erreurs  de  toute  grandeur.  De  même,  nous  pouvons  aisé- 
ment déterminer  la  portion  de  la  courbe  affectée  d'une 
erreur  d'une  certaine  importance  :  par  exemple,  le  troisième 
degré.  Il  suffit  de  noter  les  chiffres  placés  sous  les  numéros 
inscrits  à  la  seconde  ligne  :  3,  2,  1,  0,  1,  2,  3  et  de  les  addi- 
tionner ;  on  a  ainsi  3938/4096,  qui  exprime  la  probabilité  de 
réunir  dans  un  total  toutes  les  erreurs  positives  et  néga- 
tives dont  l'importance  ne  dépasse  pas  le  troisième  degré. 

Mais  d'habitude  on  ne  connaît  ni  le  nombre  des  erreurs 
possibles,  ni  leur  grandeur,  de  telle  sorte  que  les  mathé- 
maticiens raisonnent  comme  si  l'on  avait  un  nombre  infini 
d'erreurs,  hypothèse  fort  plausible  qui  a  l'avantage  de 
fournir  une  loi  générale  applicable,  par  la  voie  du  calcul, 
à  tous  les  problèmes.  La  courbe  formée  d'après  la  formule 
générale  (1)  basée  sur  un  nombre  infini  d'erreurs  et  celle 
tracée  en  supposant  qu'il  n'y  ait  qu'un  petit  nombre  de 
causes  d'erreurs,  se  ressemblant  au  point  qu'on  les  distin- 
guerait difficilement  l'une  de  l'autre. 

Quetelet  ayant  adopté  cette  démonstration  par  les  coeffi- 
cients d'expansion  binomiale,  qui  avait  été  utilisée  avant 
lui,  ainsi  du  reste  que  les  échelles  de  possibilité  et  de  pré- 
cision qui  en  dérivent,  eut  l'idée  de  l'appliquer  à  certaines 
mesures  anthropométriques.  Il  ne  semble  pas  que  cette  idée 
lui  vint  avant  1843  (2),  mais  dès  qu'elle  fut  née  il  la  déve- 

(1)  Cette  formule  générale  est  (d'après  Stanley  Jevons)  :  y  =  Ye  —  cx't, 
dans  laquelle  x  représente  l'importance  de  l'erreur,  Y  est  l'ordonnée  maximum 
de  la  courbe,  G  est  un  nombre  constant  exprimant  l'importance  de  la  tendance 
à  l'erreur  entre  chaque  série  d'observations,  e  est  une  constante  mathématique 
exprimant  la  hase  des  logarithmes  hyperboliques  (2  —  7182818).  (Stanley 
Jevons,  loc.  cit.,  p.  381.) 

(2)  fffr.  Lottin,  Quetdet,  Louvain,  1012,  pp.  151  et  suiv. 
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loppa  avec  une  complaisance  singulière,  notamment  dans 
ses  fameuses  ((  Lettres  sur  la  théorie  des  prohabilités  »  pu- 
bliées en  1846,  et  il  fut  même  tenté  de  lui  attribuer  une  por- 
tée que  des  travaux  ultérieurs,  dus  à  d'autres  statisticiens, 
ne  permettent  décidément  pas-  de  lui  accorder. 

203.  Après  cette  esquisse  rapide  des  préliminaires  de  la 
question,  revenons  à  notre  point  de  départ  et  demandons- 
nous  quel  est  le  rapport  qui  existe  entre  la  courbe  normale 
des  erreurs,  la  courbe  binomiale  et  la  répartition  des  fré- 
quences entre  les  classes  d'un  phénomène  relevé  par  la  sta- 
tistique. Ce  rapport,  qui  avait  d'abord  paru  très  fréquent, 
est,  en  réalité,  assez  rare,  si  l'on  veut  parler  de  courbes 
ayant  une  forme  très  rapprochée  de  la  courbe  normale. 
Il  n'est  pas  douteux  qu'elle  n'est  pas  une  loi  générale  de 
distribution  des  phénomènes  statistiques.  En  dehors  de 
l'anthropométrie,  on  n'en  trouve  d'application  que  dans  des 
cas  exceptionnels;  même  dans  le  domaine  de  l'anthropo- 
métrie, il  se  présente  bien  des  phénomènes  dont  la  loi  de 
distribution  est  asymétrique  (1).  Dans  quelques  cas,  la  régu- 
larité de  la  courbe  des  erreurs  est  reproduite  par  la  courbe 
de  fréquence.  «  Entre  le  polygone  binomial  et  la  courbe  nor- 
male de  fréquence,  dit  M.  Pearson,  il  existe  une  relation  très 
étroite  qui  est  de  nature  géométrique  et  qui  est  presque 
indépendante  de  la  grandeur  des  n  (2).  »  Pratiquement,  la 
réalisation  parfaite  de  cette  courbe  est  un  cas  qui  ne  se 
présente  que  fort  rarement;  on  en  obtient  le  plus  souvent 
seulement  des  images  plus  ou  moins  fidèles  qui  repro- 
duisent l'allure  générale  de  la  courbe  sans  en  présenter 
toute  la  rigueur  mathématique. 

(1)  La  distribution  des  fréquences  en  ce  qui  concerne  le  poids  des  individus 
est  du  nombre  :  While  the  distribution  of  stature  is  in  gênerai  symmetrical, 
that  of  weight  is  asymmetrical  or  skew,  the  greater  frequencies  lying  towards 
the  lower  end  of  the  range.  (Yule,  An  Introduction  to  tlic  theory  of  statisties, 
p.  93,  et  Zizek,  loc.  cit.,  p.  277.) 

(2)  .  Pearson,  «  Contributions  to  the  mathematical  theory  of  évolution. 
II  Skew  variation  in  homogeneous  material  ».  Philosophical  transactions  of 
the  Royal  Society  of  London,  A,  vol.  186  (1895). 
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Le  lecteur  trouvera,  ci-après,  suivi  du  diagramme 
correspondant,  un  tableau  indiquant  la  taille  de  8,585 
personnes  nées  dans  les  îles  Britanniques.  Ce  tableau, 
reproduit  d'après  M.  Yule,  qui  l'a  emprunté  au  «  Final 
report  »  de  la  commission  anthropométrique  de  la  «  British 
Association  »  (1883,  p.  256),  présente  une  répartition  des 
fréquences  sensiblement  égale  à  la  loi  normale  des  erreurs. 


Exemple  14. 

Stature  d'hommes  adultes  nés  en  Angleterre,  en  Ecosse,  dans  le 
pays  de  Galles  et  en  Irlande. 


Nombre  d'hommes  compris  dans  les  dites  limites 

Taille 

de  grandeur. 

sans  souliers 

Endroit  de 

naissance. 

TOTAL. 

en  pouces. 

Angleterre 

Ecosse. 

Galles. 

Irlande. 

57 

1 

1 

— 

2 

58 

3 

1 

4 

59 

12 

1 

] 

14 

fin 

39 

2 

A  1 

61 

70 

2 

9 

2 

83 

62 

128 

9 

30 

2 

169 

63 

320 

19 

48 

7 

394 

64 

524 

47 

83 

15 

669 

65 

740 

109 

108 

33 

990 

66 

881 

139 

145 

58 

1223 

67 

918 

210 

128 

73 

1329 

68 

886 

210 

72 

62 

1230 

69 

753 

218 

52 

40 

1063 

70 

473 

115 

33 

25 

646 

71 

254 

102 

21 

15 

392 

72 

117 

69 

6 

10 

202 

73 

48 

26 

2 

3 

79 

74 

16 

15 

1 

32 

75 

9 

6 

1 

16 

76 

1 

4 

5 

77  , 

1 

1 

2 

Totaux 

6194 

1304 

741 

346 

8585 

{Voir  diagramme,  page  suivante,  fig.  15.) 
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Répartition  sous  le  rapport  de  la  stature  de  8,585  hommes  adultes 
nés  dans  les  îles  Britanniques. 


Fig  15. 

» 

204.  Si  les  séries  présentant  un  développement  absolu- 
ment régulier  sont  rares,  elles  sont  par  contre  fort  nom- 
breuses, celles  dont  la  courbe  s'écarte  légèrement  de  la 
normale,  mais  dont  la  disposition  générale  rappelle  la  forme 
de  la  loi  de&  erreurs.  Quetelet  ne  s'était  pas  préoccupé  de 
différencier  les  diverses  espèces  de  courbes,  il  s'en  était 
tenu  à  la  démonstration  générale  de  la  loi  binomiale.  C  'est 
à  l'école  contemporaine  anglaise  des  statisticiens-mathéma- 
ticiens que  revient  le  mérite  d'avoir  dégagé  les  formes 
usuelles  des  courbes  statistiques  et  d'en  avoir  indiqué  les 
formules. 

Plusieurs  méthodes  se  partagent  les  mathématiciens  de 
la  statistique  en  ce  qui  concerne  la  manière  d'identifier  et 
de  calculer  les  courbes  dont  il  s'agit.  Une  première  méthode 
part  de  ce  point  de  vue  général  que  toutes  les  courbes  de 
distribution  par  fréquence  sont  originairement  dérivées  de 
la  courbe  normale  des  erreurs;  qu'il  importe  donc  que  les 
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formules  employées  pour  le  calcul  des  courbes  se  rappro- 
chent le  plus  possible  de  la  formule  de  la  courbe  normale 
des  erreurs,  et  que  si  même  la  dite  formule  ne  s'applique 
pas  entièrement  au  matériel  statistique,  elle  est  encore  pré- 
férable à  une  formule  empirique  plus  exacte,  parce  que 
celle-ci  ne  pourrait  fournir  aucune  explication  de  la  forme 
de  distribution  envisagée  (1). 

Le  professeur  Edgeworth  ^2)  a  exprimé  l'opinion  que  les 
courbes  asymétriques  sont  probablement  très  fréquentes 
dans  le  domaine  des  sciences  naturelles  et  anthropolo- 
giques; c'est  ainsi  qu'au  lieu  d'une  courbe  normale  de  la 
stature  en  Italie,  on  peut  tracer  un  certain  nombre  de 
courbes  qui  correspondent  à  des  types  réellement  distincts 
d'après  les  différentes  provinces.  Dans  un  autre  domaine, 
M.  Pearson  s'est  livré  à  une  décomposition  fort  curieuse  de 
la  courbe  de  mortalité  qu'il  a  divisée  en  ses  principaux  élé- 
ments et  il  a  fait  porter  ses  calculs  sur  les  Anglais  du  sexe 
masculin  et  sur  la  population  française  des  deux  sexes. 
La  concordance  presque  complète  des  résultats  dans  les 
deux  cas,  dit  M.  Pearson,  lui  a  inspiré  confiance  dans 
l'exactitude  des  résultats.  Les  cinq  éléments  fondamentaux 


(1)  Se  basant  sur  ces  principes,  le  professeur  Pearson  a  recherché,  dans 
une  suite  de  travaux  remarquables,  les  formules  les  plus  adéquates  pour 
diviser  en  deux  ou  trois  courbes  normales  la  représentation  des  séries  qui  ne 
paraissent  pas  obéir  à  la  courbe  normale  des  erreurs.  Antérieurement  au 
savant  anglais,  M.  Bertillon  père  avait  déjà  montré  que  si  deux  types 
d'hommes  se  trouvaient  juxtaposés  dans  un  pays,  la  présence  des  deux  races 
se  trahirait  dans  le  diagramme  des  tailles;  s'inspirant  des  considérations 
développées  par  Qdetelet,  le  docteur  Bertillon  père  a  en  effet  montré  un 
exemple  fort  remarquable  d'une  courbe  à  deux  sommets  relative  à  la  taille 
des  conscrits  dans  le  département  du  Doubs  (1858-1867).  La  méthode  de 
M.  Pearson  pour  diviser  en  plusieurs  courbes  régulières  une  courbe  asy- 
métrique a  été,  au  point  de  vue  mathématique,  l'objet  de  grands  éloges;  on 
lui  a  cependant  reproché  d'être  très  laborieuse  et  l'on  a  suggéré  quelques 
simplifications. 

(2)  «  On  the  représentation  of  statistics  by  mathematical  Formulae  » 
(part.  II),  par  le  professeur  Edgeworth.  (Journal  of  the  Royal  Statistical 
Society,  1899,  p.  126.) 
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de  la  courbe  de  mortalité  pour  les  Anglais  du  sexe  masculin 
sont  les  suivants,  les  nombres  se  rapportant  à  1,000  per- 
sonnes nées  dans  la  même  année  (1)  : 

Mortalité  de  la  vieillesse,  verticale-centrale  ou  domi- 
nante (mode)  (2),  67  ans; 

Mortalité  de  l'âge  mûr,  verticale-centrale  ou  dominante, 
41.5  ans; 

Mortalité  de  la  jeunesse,  verticale-centrale  ou  dominante, 
22.5  ans; 

Mortalité  de  l'enfance,  verticale-centrale  ou  dominante, 
6.06  ans; 

Mortalité  du  premier  âge,  verticale-centrale  ou  domi- 
nante, 156  jours. 

205.  Une  seconde  méthode  est  celle  préconisée  par 
Fechner  dès  1878  et  développée  par  lui  en  1897,  on  pourrait 
l'appeler  la  «  méthode  de  reconstitution  »  ;  elle  est  basée 
sur  l'hypothèse  que  la  courbe  de  Gauss  pourrait,  dans  cer- 
tains cas,  être  asymétrique. 

L'auteur  de  cette  méthode  a  été  frappé  d'une  part  de  la 
ressemblance  qu'il  y  a  entre  la  courbe  normale  des  erreurs 
et  la  distribution  des  fréquences  dans  de  nombreuses  séries 
statistiques;  d'autre  part,  il  n'a  pas  manqué  de  remarquer 
que  les  cas  de  similitude  complète  étaient  fort  rares.  De  là 
une  hypothèse,  à  première  vue  assez  plausible,  a  surgi  :  les 
courbes  irrégulières  ne  seraient-elles  pas  deux  parties  de 
la  courbe  normale  mais  dont  le  degré  de  dispersion  serait 
différent  ?  Quetelet,  sans  procéder  à  une  analyse  mathéma- 
tique, avait,  somme  toute,  indiqué  les  données  de  cette  hypo- 
thèse en  développant  les  conséquences  de  la  loi  binomiale; 


(1)  Peaiîson,  Contributions  to  the  mathematical  theory  of  évolution,  p.  407. 

(2)  La  dominante  ou  mode  est  la  mesure  prise  sur  l'axe  horizontal  (axe  des 
abscisses)  qui  correspond  à  la  hauteur  la  plus  grande  prise  sur  l'axe  vertical 
(axe  des  ordonnées).  Pour  les  données  élémentaires  de  la  construction  gra- 
phique, cfr.  supra  n°  201. 
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il  commence  par  tracer  la  courbe  de  possibilité  pour  un  ti- 
rage de  boules  de  deux  couleurs  de  999  boules  ;  cette  courbe 
a  la  forme  d'une  cloche  aux  parois  très  évasées;  s'il  s'agit 
de  calculer  et  de  construire  la  courbe  de  possibilité  pour  un 
nombre  de  boules  quadruple  (3996)  et  la  perpendiculaire 
(le  mode)  représentant  la  probabilité  de  l'événement  le  plus 
probable,  on  obtient  une  courbe  en  forme  de  cloche  beau- 
coup plus  resserrée  et  qui  ressemble  à  la  pointe  d'une 
toupie  ;  finalement,  <(  plus  le  nombre  de  boules  que  l 'on  prend 
à  chaque  tirage  est  considérable,  plus  il  tend  à  s'établir  une 
égalité  entre  le  nombre  de  boules  blanches  et  le  nombre  de 
boules  noires.  Si  les  choses  étaient  poussées  à  l'extrême,  et 
si  chaque  tirage  amenait  un  nombre  infini  de  boules,  la  ligne 
de  possibilité  se  réduirait  insensiblement  à  la  perpendicu- 
laire... (1)  ».  Or,  si  l'on  réunissait  deux  moitiés  de  courbes, 
l'une  se  rapportant  à  un  nombre  x  de  boules  et  l'autre  à 
un  nombre  différent,  on  obtiendrait  une  courbe  irrégulière 
se  rapprochant  de  la  normale  et  dont  l'irrégularité  serait 
due  au  nombre  différent  d'épreuves  exprimé  par  chaque 
partie. 

La  méthode  de  Fechner  consiste  donc  à  considérer  sépa- 
rément chaque  moitié  d 'une  courbe  asymétrique  et  à  la  com- 
pléter par  une  autre  moitié  identique  à  la  première,  de  façon 
à  construire  une  courbe  plus  ou  moins  évasée,  mais  régu- 
lière. Lorsque  l'écart  de  l'extrémité  de  la  courbe  au  centre 
n'est  pas  trop  grand,  on  peut,  d'après  Fechner,  procéder 
en  opérant  sur  les  données  arithmétiques,  mais  si  l'écart  est 
très  considérable,  il  est  préférable,  selon  cet  auteur,  de 
substituer  aux  nombres  eux-mêmes  leurs  logarithmes,  de 
placer  ces  logarithmes  en  série,  de  chercher  la  dominante 
(mode)  et  d'étudier  les  écarts  des  logarithmes  autour  de 
leur  mode.  La  raison  en  est  que  la  déviation  purement 
arithmétique  indique  seulement  la  différence  entre  la 


(1)  Quetelet,  Lettres  sur  la  théorie  des  probabilités.  Bruxelles,  1846, 
lettre  XVI,  pp.  106  (fig.)  et  107. 
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moyenne  et  les  nombres  naturels,  tandis  que  les  mesures 
prises  sur  les  logarithmes  indiquent  les  variations  rela- 
tives, d'après  lesquelles  on  peut  mieux  se  rendre  compte 
des  changements  survenus  dans  les  phénomènes  collectifs. 

206.  D'autres  méthodes  d'analyse  des  courbes  ont  encore 
été  essayées  par  les  statisticiens-mathématiciens,  notam- 
ment par  Edgeworth.  La  classification  générale  des  types 
de  courbes  asymétriques  a  été  proposée  par  le  professeur 
Pearson  sur  la  base  de  cinq  types  (1),  auxquels  il  a  plus 
tard  ajouté  un  sixième  type  en  U  (2).  Les  six  types  reconnus 
et  calculés  par  M.  Pearson  sont  les  suivants  : 

Type  T.  Axe  des  abscisses  limité  de  part  et  d'autre,  courbe 
asymétrique. 

Type  IL  Axe  des  abscisses  limité  de  part  et  d'autre, 
symétrique. 

Type  III.  Axe  des  abscisses  limité  d'un  seul  côté,  courbe 
asymétrique. 

Type  IV.  Axe  des  abscisses  illimité  des  deux  côtés,  courbe 
asymétrique. 

Type  V.  Axe  des  abscisses  illimité  des  deux  côtés,  courbe 
symétrique  ou  courbe  normale  des  erreurs,  de  Gauss,  dont 
nous  avons  parlé  plus  haut  (voir  n°  202). 

Type  VI.  Forme  de  la  courbe  en  U. 

Pour  déterminer  le  type  de  courbe  auquel  se  rapporte  une 
série,  il  faut  procéder  à  des  calculs  compliqués  et  laborieux. 
On  doit  se  demander  en  premier  lieu  si  l'on  se  trouve 
devant  une  courbe  comprenant  un  seul  «  mode  »  ou  en  com- 
prenant plusieurs  ;  ce  point  déterminé,  on  a  à  rechercher  si 


(1)  Pearson,  «  Contribution  to  the  theory  of  mathematical  évolution.  Skew 
variations  in  homogoneous  material  ».  Philosophical  Transactions  of  the 
Royal  Society  of  London,  1895,  I,  p.  360. 

(2)  «  Cloudiness  »  :  Note  on  a  novel  case  of  Frequency,  by  Karl  Pearson. 
(Proceedings  of  the  Royal  Society,  LXII,  1897-1898,  p.  287  à  290.) 
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la  courbe  est  simple  ou  complexe  ;  les  courbes  étudiées  par 
le  professeur  Pearson,  et  que  nous  venons  d'énumérer,  sont 
des  courbes  simples.  En  général,  les  courbes  qui  ne  com- 
prennent qu'un  seul  «  mode  »  et  sont  basées  sur  un  ma- 
tériel homogène,  appartiennent  à  la  classe  des-  courbes 
simples.  On  peut  donc,  dans  un  cas  semblable,  confronter 
les  graphiques  à  ceux  représentant  les  courbes  typiques  de 
Pearson  et  les  classer  dans  l'une  ou  l'autre  catégorie  sans 
devoir  se  livrer  à  des  calculs  laborieux.  L'exposé  des  mé- 
thodes mathématiques  du  professeur  Pearson  ne  peut  se 
faire  à  cet  endroit,  parce  qu'il  suppose  connus  des  points 
dont  l'examen  n'est  abordé  que  plus  loin  (détermination  de 
la  moyenne,  de  la  dominante  et  de  la  médiane,  de  la  stan- 
dard déviation,  etc.).  On  en  trouvera  un  exposé  au  cha- 
pitre TI  de  notre  livre  III.  Nous  nous  bornerons  ici  à  repro- 
duire des  exemples  des  différents  types  de  courbes  et  à  y 
joindre  le  graphique  correspondant. 

207.  Pour  plus  de  commodité,  nous  réunirons  dans  cet 
exposé  plusieurs  types  présentant  des  caractères  à  peu  près 
semblables  et,  en  premier  lieu,  nous  en  examinerons  les 
courbes  de  distribution  légèrement  asymétriques  dans  les- 
quelles la  distribution  par  fréquence  croît  et  décroît  plus 
rapidement  d'un  côté  que  de  l'autre.  Ces  courbes  sont  les 
plus  fréquentes;  on  en  trouve  des  exemples  dans  tous  les 
domaines  et  elles-  abondent  dans  les  questions  économiques. 
C'est  ainsi  que  M.  Yule  a  trouvé  un  excellent  exemple  de 
distribution  modérément  symétrique  dans  un  tableau  don- 
nant pour  l'Angleterre  et  le  pays  de  Galles,  en  1891,  le 
nombre  de  districts  d'enregistrement  comptant  un  certain 
pourcentage  de  la  population  secourue  (1). 


(1)  U.  G-.  Yule,  An  introduction  to  the  Theory  of  S'tatistics,  London,  1911, 
pp.  92-93.  Cfr.  Analyse  mathématique  de  la  courbe,  par  le  prof.  Pearson, 
loc.  cit.,  p.  405. 
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Nous  reproduisons  ci-après  le  tableau  dressé  par  M.  Yule 
et  le  polygone  de  fréquence  qui  en  traduit  les  données  (voir 
diagramme  page  suivante,  fig.  16)  : 

Exemple  15 

Proportion  Nombre  d'unions 

de  la  population  comptant 
recevant  des  secours.  la  proportion  ci-contre. 

0.75  —  1.25   18 

1.25  —  1.75    48 

4.75  —  2.25                               .    .  72 

2.25  —  2.75    89 

2.75  —  3.25   100 

3.25  —  3.75    90 

3.75  —  4.25  .   75 

4.25  —  4.75    60 

4.75  —  5.25    40 

5.25  —  5.75       21 

5.75  —  6.25                                   .  H 

6.25  —  6.75  .........  5 

6.75  —  7.25    1 

7.25  —  7.75    1 

7.75  —  8.25    0 

8.25  —  8.75   1 

Total.    .    .  632 


La  distribution  des  salaires  parmi  une  population 
ouvrière  homogène  fournit  aussi  un  bon  exemple  de  courbe 
légèrement  asymétrique.  On  y  voit  nettement  qu'un  assez 
grand  nombre  d'hommes  atteignent  rapidement  le  taux 
auquel  correspond  le  «  mode  »  ;  puis,  vers  les  taux  supé- 
rieurs, leur  nombre  diminue  sensiblement  ;  vers  la  fin  de  la 
série,  les  proportions  d'ouvriers  gagnant  les  plus  hauts 
salaires  deviennent  très  minimes  (fig.  17). 


22 
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Proportion  de  la  population  secourue.  —  Angleterre,  1891. 


Fig.  16. 

Distribution  des  salaires  parmi  les  ouvriers  des  mines  de  houille 
travaillant  au  fond.  —  Belgique  1896. 


Moins  dt  liOfr  dtlSOi!33.de2JOa2t3.deZMàZ3ide3»»3«.de3M»3?UeVO0s*nde«.^ 

Fig.  17. 


SÉRIES,   SÉRIAT10N,  DISTRIBUTION 


339 


BELGIQUE.  —  Taux  des  salaires  dans  les  mines  de  houille, 
octobre  1896  (1). 


Exemple  16. 


Taux 
des 
salaires. 

Moins  de  fr.  1  50  . 
de  1.50  à  1.99  . 
2.00  à  2.49  . 
2.50  à  2.99  . 
3.00  à  3.49. 
3.50  à  3.99  . 
4.00  à  4.49  . 
4.50  à  4.99  . 
5.00  à  5  49  . 
5.50  à  5.99  . 
6.00  à  6.49  . 
6.50  à  6.99  . 
7.00  à  7.49  . 


TOTAL 


Nombre 
d'hommes  adultes  du  fond 
.  ayant  touché 
les  salaires  ci-contre. 


155 
861 
2,860 
7,660 
16,456 
13,444 
11,235 
5,057 
1,888 
785 
439 
190 
263 


61,293  (2) 


Lorsqu'il  y  a  une  augmentation  générale  des  salaires,  la 
courbe  se  déforme  :  elle  s'aplatit,  le  nombre  de  classes 
augmente  vers  la  droite  et  les  fréquences  y  sont  plus  élevées 
que  précédemment. 

Pour  emprunter  un  exemple  à  la  physiologie,  nous  repro- 
duisons ci-après,  d'après  Quetelet,  qui  en  a  fait  usage  dans 
ses  «  Lettres  sur  la  théorie  des  probabilités  »,  un  tableau 
donnant  les  mesures  prises  sur  les  poitrines  de  5,738  soldats 
1  des  régiments  écossais.  Quetelet  avait  utilisé  les  chiffres 
publiés  dans  le  treizième  volume  du  Journal  médical 
d'Edimbourg  (3). 


(1)  Chiffres  extraits  de  la  Statistique  des  salaires  dans  les  mines  de  houille, 
octobre  1896-mai  1900,  Office  du  Travail,  Bruxelles,  1901,  p.  34. 

(2)  Il  n'a  pas  été  tenu  compte  de  six  ouvriers  occupés  dans  un  charbonnage 
à  un  travail  spécial  et  ayant  gagné  des  salaires  supérieurs  à  fr.  7.50. 

(3)  Quetelet,  Lettres  sur  la  théorie  des  probabilités.  Bruxelles,  1846,  p.  136. 
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Exemple  17. 

Mesures  de  la  circonférence  des  poitrines  des  soldats  écossais. 

Mesures 

de  la  poitrine                    .  Nombre 

(pouces).  d'hommes. 

33   3 

34   18 

35   81 

36   185 

37   420 

38   749 

39    1,073 

40  ...    .   1,079 

41   934 

42    658 

43    370 

44   92 

45    ...    .   50 

46   21 

47   4 

48   1 

Total    .    .    .  5,738 


Mesures  de  la  poitrine,  en  pouces. 

Fig.  18. 
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208.  Formes  de  distribution  entièrement  asymétriques.  — 
Lorsque  la  courbe  présente  un  maximum  dès  le  début,  suivi 
d'une  chute  rapide,  la  courbe  est  dite  asymétrique.  C'est  la 
forme  qu'affecte  la  courbe  des  revenus  calculée  par  Vilfredo 
Pareto,  forme  bien  connue  et  qui  ressemble  à  la  pointe 
d'une  toupie  qu'on  aurait  coupée  en  deux  par  le  milieu. 
La  même  forme  se  retrouve  dans  un  grand  nombre  de  phé- 
nomènes économiques  et  dans  la  répartition  de  certains 
faits  naturels,  principalement  en  botanique.  Il  importe 
cependant  de  faire  une  réserve  :  peut-être  la  forme  asymé- 
trique de  la  courbe  n'est-elle  due  qu'à  l'insuffisance  numé- 
rique des  observations  ou  au  fait  qu'elles  n'ont  pas  été 
faites  d'une  manière  assez  précise.  Parmi  les  faits  écono- 
miques, l'un  de  ceux  qui  fournissent  une  bonne  illustration 
est  la  répartition  de  la  valeur  fiscale  des  maisons,  avec  le 
nombre  de  celles-ci,  en  Angleterre  et  dans  le  Pays  de  Galles. 
M.  Pearson,  dans  son  mémoire  déjà  cité,  a  analysé  les 
chiffres  produits  par  M.  Goschen,  dans  un  discours  prési- 
dentiel adressé  à  la  Société  de  Statistique  de  Londres  en 
1887  et  a  montré  que  les  résultats  du  calcul  et  de  la  statis- 
tique ne  s'écartent  l'un  de  l'autre  que  dans  une  proportion 
très  faible  (1). 

Voici  les  chiffres  de  Goschen;  nous  les  faisons  suivre  de 
l'histogramme  calculé  par  M.  Pearson  {voir  diagramme 
page  suivante,  fig.  19.) 


Exemple  18.  —  Maisons;  Angleterre  et  Pays  de  Galles,  1885-1886. 


Taux 

Nombre 

Taux 

Nombre 

d'évaluation. 

de  maisons. 

d'évaluation. 

de  maisons. 

Moins  de  10  £. 

3,174,806 

£ 

80  à  £  100 

47,326 

£  10  à  £  20  . 

1,450,781 

£ 

100  à  £  150 

58,871 

£  20  à  £  30  . 

441,595 

£ 

150  à  £  300 

37,988 

£  30  à  £  40  . 

259,756 

£ 

300  à  £  500 

8,781 

£  40  à  £  50  . 

150,968 

£ 

500  à  £  1000 

3,002 

£  50  à  £  60  . 

90,432 

£  1000  à  £  1500 

1,036 

£  60  à  £  80  . 

104,128 

(1)  Peabson,  loc.  cit.,  pp.  396  et  suivantes. 
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Nombre  et  râleur  des  maisons  en  Angleterre  1885-1886. 


Valeur  t.  0-10    10-20   20-30  30-40   40-50   50  60  60-80  80-100  100 150  au  dessJs 
ri     il  ...  de  150. 

Lchelle:  200  000  maisons  par  centimètre  carré. 
Fig.  19 

Des  courbes  analogues  se  rencontrent,  avons-nous  déjà 
dit,  à  propos  de  phénomènes  d'ordre  botanique.  La  varia- 
tion du  nombre  de  pétales  des  fleurs  d'une  espèce  donnée  a 
souvent  donné  lieu  à  de  pareilles  constatations.  En  1887, 
M.  H.  De  Vries  ayant  repiqué  dans  son  jardin  un  certain 
nombre  d'exemplaires  de  Ranunculus  bulbosus,  compta 
l'année  suivante  le  nombre  de  pétales  que  présentaient 
222  fleurs  de  ces  plantes.  Les  résultats  sont  consignés 
ci-après  : 
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Nombre  de  pétales  5  6  7  8  9  10 
Fréquence  133    55    23    7    2  2 

Ici  encore,  selon  M.  Pearson,  les  résultats  du  calcul  et  de 
l'expérience  s'accordent  d'une  manière  remarquable  (1). 

209.  Formes  de  distribution  asymétriques  en  U.  — Après 
avoir  exposé  les  formes  de  distribution  indiquées  ci-dessus, 
M.  Pearson,  dans  son  mémoire  sur  les  Shew  variations, 
disait  que,  théoriquement,  on  pouvait  s'attendre  à  rencon- 
trer des  cas  de  distribution  des  fréquences  se  trouvant  à 
l 'opposite  de  la  distribution  normale,  c'est-à-dire  que  les 
extrémités  de  la  courbe  correspondraient  à  un  maximum, 
tandis  que  le  minimum  de  fréquence  se  trouverait  au  centre. 
En  1897,  M.  Pearson  communiqua  à  la  «  Royal  Society  » 
de  Londres  un  exemple  de  cette  forme  spéciale  de  distribu- 
tion qu'il  appela  forme  en  U  (2).  Cet  exemple  est  emprunté 
à  un  relevé,  divisé  en  10  degrés,  du  point  de  nébulosité 
(cloudiness)  à  Breslau  pendant  les  années  1876-1885,  com- 
prenant 3,653  jours  d'observation. 

Les  données  numériques  de  la  courbe  sont  les  suivantes  : 
Degrés  0     1     234  5    67     8     9  10 

Fréquence    751  179  107  69  46  9  21  71  194  117  2089 

Bien  que  la  distinction  par  degrés  de  nébulosité  durant 
une  journée  entière  renferme  nécessairement  une  part  d'ap- 
proximation, M.  Pearson  note  cependant  que  le  rapport 
entre  le  calcul  et  l'observation  est,  dans  ce  cas  encore,  fort 
satisfaisant. 

On  peut  rapprocher  de  cet  exemple  les  données  suivantes 
qui  concernent  le  nombre  moyen  de  journées  sans  soleil,  à 
l'observatoire  royal  d'Uccle,  pendant  les  années  1886  à 
1912.  Voici  les  données  publiées  à  ce  sujet  par  l'Institut 


(1)  Pearson,  loc.  cit.,  p.  401. 

(2)  Pearson,  «  Cloudiness  »  :  Note  on  a  novel  case  of  Frequency.  (Pro- 
ceedings  of  the  Royal  Society,  vol.  LXII  (1897),  p.  287.) 
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royal  météorologique  (1),  suivies  de  l'histogramme  qui  s'y 
rapporte  (voir  diagramme  ci-dessous,  fig.  20). 


Exemple  19. 


Mois. 


Nombre  moyen- 
de  jours. 


Janvier   13,1 

Février   8,6 

Mars    5, 1 

Avril   2,3 

Mai   1,6 

Juin    ........  1,7 


Mois. 


Nombre  moyen 
de  jours. 


Juillet   1,1 

Août   0,9 

Septembre   2,0 

Octobre   4,9 

Novembre   10,2 

Décembre   12,8 


Nombre  moyen  de  jours  sans  soleil.  —  Uccle,  1886-1912. 


Fia.  20. 


210.  Pour  terminer  cet  exposé  sommaire,  il  reste  à  se  de- 
mander quel  est  le  résultat  scientifique  obtenu  par  les  cal- 
culs auxquels  nous  avons  fait  allusion  plus  d'une  fois.  Il 
faut  distinguer,  semble-t-il,  entre  les  formules  purement 
empiriques  et  celles  qui  sont  basées  sur  la  loi  de  distribu- 
tion des  erreurs.  Les  formules  purement  empiriques 
peuvent  être  considérées  comme  une  représentation  mathé- 
matique d'un  phénomène,  mais  elles  n'expriment  pas  la 
loi  du  phénomène. 

Il  en  va  autrement  pour  les  formules  basées  sur  la  loi 


(1)  Belgique.  Annuaire  météorologique,  1914,  p.  25. 
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de  Gauss.  Edgeworth  a  fait  observer  qu'elles  fournissent 
une  explication  plausible  de  la  construction  des  séries  aux- 
quelles elles  s'appliquent.  Lorsque  la  distribution  normale 
des  erreurs  concerne  des  mesures  prises  un  grand  nombre 
de  fois  sur  un  même  objet,  on  doit  supposer  que  l'on  se 
trouve  en  présence  d'un  grand  nombre  d'erreurs  acciden- 
telles, positives  et  négatives,  qui  se  contrebalancent  et  sont 
d'autant  moins-  nombreuses  qu'elles  sont  plus  importantes; 
c'est  l'hypothèse  fondamentale  de  Gauss.  Par  assimilation, 
on  a  étendu  la  loi  de  Gauss  à  des  observations  nombreuses 
portant  sur  des  objets  différents,  mais  de  même  nature,  et 
l'on  a  trouvé  que,  dans  certains  cas,  la  loi  normale  des 
erreurs  pouvait  aussi  trouver  son  application.  Mais  ces 
cas,  —  on  l'a  reconnu  après  s'être  laissé  trop  facilement 
suggestionner  par  cette  hypothèse  séduisante  —  sont, 
somme  toute,  fort  rares;  on  ne  les  rencontre  guère  que 
dans  le  domaine  des  recherches  anthropologiques  et  pour 
un  nombre  de  faits  limités  seulement.  Ce  qui  est  le  cas  le 
plus  fréquent,  ce  sont  les  courbes  irrégulières  qui  rappellent 
la  courbe  normale  de  Gauss,  mais  s  'en  éloignent  par  quelque 
point.  Mais  lorsqu'on  observe  une  courbe  irrégulière,  on  ne 
peut  plus  dire  qu'on  se  trouve  en  présence  d'erreurs  acci- 
dentelles commises  en  nombre  égal  dans  le  sens  positif 
comme  dans  le  sens  négatif  et  dont  l'importance  diminue 
à  mesure  qu  'elles  s 'écartent  de  la  moyenne.  La  seule  expli- 
cation plausible  reste  alors  que  des  forces  opposées  et 
d'importance  inégale  luttent  en  sens  contraire.  L'infinie 
variété  de  ces  courbes  nous  écarte  alors  de  la  notion  simple 
de  loi.  Si  la  distribution  des  salaires,  à  une  époque  donnée, 
s 'exprime  par  une  certaine  courbe,  et  quelques  années  plus 
tard  par  une  courbe  toute  différente  (1),  comment  pour- 


(1)  Voyez,  p;ir  exemple,  les  courbes  de  distribution  des  salaires  des  ouvriers 
des  mines  de  houille  de  Belgique,  très  différentes  à  deux  époques  d'obser- 
vation distantes  de  moins  de  quatre  ans.  (Statistique  des  salaires  dans  les 
mines  de  houille,  octobre  1896-mai  1900;  publication  de  l'Office  du  Travail 
de  Belgique,  planches  insérées  entre  les  pages  34  et  35.) 
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rait-on  dire  que  la  courbe  exprime  la  loi  du  phénomène  ! 
Elle  ne  fait  que  représenter  graphiquement  et  mathémati- 
quement l'aspect  du  phénomène  à  deux  époques.  Le  calcul 
mathématique  définit  rigoureusement  les  courbes  en  pré- 
sence et  à  cet  égard  il  est  un  moyen  de  représentation  beau- 
coup plus  achevé  que  tout  autre,  mais  il  ne  peut  fournir 
l'explication  causale  du  phénomène.  La  relation  qui  existe 
entre  le  montant  du  salaire  et  le  nombre  de  personnes  rece- 
vant le  salaire  indiqué  à  chaque  taux  est  simplement  mathé- 
matique; la  formule  ne  fait  que  préciser  le  contour  et 
l'étendue  de  la  masse  considérée,  elle  n'a  pas  pour  objet 
d'en  découvrir  ni  d'en  définir  le  lien  causal  (1). 
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CHAPITRE  II 


Moyennes,  médiane,  dominante 

I.  —  Définitions,  classification,  espèces  de  moyennes. 

212.  Entre  les  manifestations  changeantes  et  complexes 
des  phénomènes  collectifs,  l'observateur  est  invinciblement 
amené  à  chercher  une  donnée  numérique  représentative  de 
Ja  masse.  Ce  besoin  de  simplification  est  universel,  et  ré- 
pond à  une  nécessité  de  notre  nature;  l'esprit  humain  est 
incapable  de  concevoir,  avec  une  précision  suffisante,  un 
ensemble  de  faits  présentant  une  certaine  complexité  :  les 
différences  s'atténuent,  les  ressemblances  s'effacent,  il  ne 
reste  plus,  après  un  certain  temps,  qu'une  image  confuse, 
presque  impossible  à  définir.  Veut-on  cependant  comparer 
l'une  à  l'autre  deux  observations  portant  sur  des  phéno- 
mènes collectifs,  il  est  impossible  de  se  contenter  de  notions 
vagues  et  fuyantes.  Les  séries  doivent  se  caractériser,  se 
synthétiser  en  une  expression  numérique  simple.  C'est  à 
ce  besoin  que  répondent  les  moyennes  et  leurs  variantes,  la 
médiane  et  la  dominante  (1). 

M.  Bowley,  après  avoir  passé  en  revue  les  diverses 
moyennes,  résume  ainsi  leur  fonction  générale  :  «  Elle  con- 
siste, dit-il,  à  exprimer  un  groupe  complexe  au  moyen  de 


(1)  La  dominante  est  l'expression  proposée  par  M.  L.  March  pour  corres- 
pondre, en  français,  au  terme  «  mode  »  employé  par  les  auteurs  anglais. 
Nous  adoptons  cette  terminologie. 
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quelques  nombres  simples.  L'esprit  humain  ne  peut  à  la  fois 
embrasser  des  grandeurs  de  millions  de  termes;  elles  doi- 
vent être  groupées,  classées,  mises  en  moyennes  (1).  » 

M.  Yule,  en  étudiant  les  moyennes,  commence  par  faire 
ressortir  ce  que  les  procédés  de  classification  présentent 
d'insuffisant,  pour  caractériser  la  distribution  des  va- 
riables; la  définition  quantitative  s'impose,  surtout  quand 
on  désire  établir  des  comparaisons  entre  les  caractères  cor- 
respondants de  deux  ou  plusieurs  séries.  L'essence  de  la 
moyenne  consiste  donc  dans  son  pouvoir  de  représenta- 
tion (2). 

L'impression  qui  se  dégage  de  l'ouvrage  de  M.  von  Mayr 
est  la  même;  pour  cet  auteur  également,  la  fonction  de  la 
moyenne  est  de  donner  une  seule  expression  simple  qui 
contient  en  elle-même  le  résultat  net  de  la  série  entière  (3). 

L'opinion  de  M.  Benini  ne  diffère  pas  des  précédentes  : 
«  La  moyenne,  dit-il,  répond  à  un  besoin  de  notre  esprit, 
incapable  de  retenir  une  série  exacte  d'impressions  se  rap- 
portant à  diverses  grandeurs  numériques...;  elle  substitue 
à  la  série  un  terme  unique,  à  la  formation  duquel  concourent 
et  collaborent  tous  les  termes  donnés  (4).  » 

On  peut  dire  que  la  statistique  moderne  est  unanime  sur 
ce  point;  la  moyenne  est  une  représentation  abrégée  de  la 
série,  c'est  une  sorte  de  procédé  mnémotechnique  appliqué 
aux  données  numériques. 

213.  Que  la  moyenne  soit  bien  réellement  un  terme  qui 
synthétise  et  représente  tous  les  autres,  nul  n'y  contredira, 
mais  n'est-elle  que  cela?  Et  à  se  borner  à  ensisager  cette 


(1)  Bowley  (A.  L.),  Eléments  of  statistics,  p.  130. 

(2)  Yule  (G.  U.),  An  introduction  to  the  theory  of  statistics,  p.  107. 

(3)  Mayr  (G.  von),  Theoretische  statistik,  p.  98. 

(4)  Benini  (R.  ),  Principii  di  statistica,  p.  91. 
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face  de  la  question,  ne  risque-t-on  pas  de  simplifier,  un  peu 
plus  qu'il  ne  conviendrait,  le  problème  qui  nous  occupe? 

Certains  statisticiens  ont  poussé  plus  avant  l'analyse. 
Frappés  des  propriétés  mathématiques  de  la  moyenne,  pro- 
priétés qui  étaient  déjà  connues  des  anciens,  ils  s'arrêtent 
volontiers  à  cet  aspect  des  choses  et  en  tiennent  compte 
dans  leurs  définitions.  L'expérience  nous-  apprend  que  les 
résultats  des  mesures  prises  sur  une  quantité  continue  sont 
seulement  d'une  exactitude  approximative.  Entre  les  di- 
verses mesures  prises  d'un  même  objet,  la  moyenne  est  la 
plus  exacte  et  l'erreur  probable  de  la  moyenne  d'un  grand 
nombre  de  termes  est  moindre  que  celle  de  chaque  terme 
en  particulier.  Ne  suit-il  pas  de  ces  théorèmes,  que  la 
moyenne  est  quelque  chose  de  plus  que  la  simple  représen- 
tation synthétique  d'une  série?  Il  nous-  semble  que  Lexis  a 
parfaitement  exposé  ce  point  de  vue.  «  Une  formule  pure- 
ment empirique,  dit-il,  ne  nous  apprend  rien  de  nouveau; 
ce  n'est  qu'une  condensation  plus  ou  moins  commode  des 
chiffres  observés  ;  mais,  quand  on  réussit  à  démontrer  que, 
dans  un  grand  nombre  de  chiffres  observés,  il  y  en  a  un 
ou  plusieurs  autour  desquels  les  autres  se  groupent  d'après 
une  formule  établie  à  priori,  on  aura  fait,  selon  moi,  un 
pas  au  delà  du  simple  empirisme  des  courbes  paraboliques. 
On  n'aura  pas  établi  une  loi,  mais  on  aura  simplifié  la 
complexité  des  phénomènes,  en  les  soumettant  à  un  point  de 
vue  rationnel  et  à  une  hypothèse  plausible  (1).  »  Et  plus 
loin  :  «  Toutes  les  fois  que  les  influences  positives  et  néga- 
tives sont  d'une  possibilité  égale,  qu'elles  sont  très  nom- 
breuses et  que  leur  intensité  moyenne,  mesurée  par  leur 
effet  sur  le  rapport  variable  reste  égale,  les  rapports 
observés,  pris  en  assez  grand  nombre,  se  rangeront  autour 


(1)  Lexis  (W.)  :  «  Sur  les  moyennes  normales  appliquées  aux  mouvements 
de  ia  population  et  sur  la  vie  normale  »  (Annales  de  démographie  inter- 
nationale, t.  V,  1880,  p.  481). 
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de  leur  moyenne,  selon  la  formule  exponentielle,  et,  même 
quand  on  n'en  a  qu'un  nombre  restreint,  on  en  peut  déduire 
leur  écart  probable  avec  une  exactitude  suffisante  (1).  » 
Ce  caractère  de  la  moyenne  n'a  rien  de  mystérieux;  «  il  ne 
fait  qu'exprimer  le  résumé  abrégé  de  certains  faits  et  rela- 
tions »  (2). 

Il  y  a  lieu,  à  notre  avis,  de  tenir  compte  de  ce  caractère 
et  c'est  pourquoi  nous  proposons  de  définir  la  moyenne  : 
l'expression  de  l'état  quantitatif  normal  d'un  phénomène 
I  déterminé.  En  disant  que  la  moyenne  est  une  expression 
de  l'état  dont  il  s'agit,  nous  entendons  marquer  son  carac- 
tère descriptif  et  nous  rejetons,  en  même  temps,  toute  idée 
d'après  laquelle  la  moyenne  serait  quelque  chose  de  sub- 
stantiel ou  marquerait  l'action  d'une  force  coercitive.  En 
parlant  de  l'état  quantitatif ,  nous  limitons  aux  relations 
numériques  le  domaine  de  la  moyenne.  Le  terme  normal 
a  aussi  une  grande  signification  dans  la  définition  :  il  tient 
compte  de  l'action  de  la  distribution  exponentielle  des  va- 
riables rangés  autour  de  la  moyenne. 

214.  On  peut,  dès  à  présent,  envisager  les  quantités  à  réu- 
nir dans  les  moyennes  (3). 

1°  Une  moyenne  n'est  pas  et  ne  peut  pas  être  le  résultat 
d'une  approximation.  Elle  suppose  toujours  un  calcul 
réalisé  dans  de  rigoureuses  conditions  d'exactitude.  Par 
conséquent,  les  évaluations  vulgaires,  confondues  à  tort 
avec  les  moyennes,  n'en  sont  pas,  en  réalité.  Lorsqu'on  dit  : 
((  un  ouvrier  menuisier  gagne,  en  moyenne,  3  fr.  50,  dans 
telle  localité  »,  on  exprime  un  jugement  qui,  d'après  la 
sagacité  de  l'observateur,  a  plus  ou  moins  de  chances  de  se 


(1)  Lexis  (W.)  :  «  Sur  les  moyennes  normales  appliquées  aux  mouvements 
de  la  population  et  sur  la  vie  normale  »  (Annales  de  démographie  inter- 
nationale, t.  V,  1880,  p.  488). 

(2)  Id.,  loc.  cit.,  p.  488. 

(;î)  Cfr.  sur  ce  point  Yule  (G.  U. ),  An  introduction  to  the  theory  of 
statistics,  p.  108,  et  Bowley  (A.),  Eléments  of  statistics,  p.  130. 
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rapprocher  de  la  réalité,  mais  qui,  en  l'absence  des  calculs 
nécessaires,  n'a  pas  le  caractère  d'une  moyenne.  C'est  pour 
cette  raison  que  beaucoup  de  relevés  dos  salaires,  dans  des 
enquêtes  anciennes,  sont  sans  valeur;  ces  évaluations  sont 
élevées  ou  réduites  d'après  le  degré  d'optimisme  ou  de  pes- 
simisme du  témoin,  ou  selon  son  intérêt  personnel.  (Cfr.  les 
curieuses  divergences  entre  les  témoignages  de  patrons  et 
d'ouvriers  dans  les  enquêtes  industrielles,  par  exemple  dans 
l'enquête  de  la  Commission  du  travail,  en  Belgique,  en 
1886.) 

2°  Elle  doit  être  basée  sur  toutes  les  observations  faites. 
Dans  le  cas  contraire,  elle  n'est  pas,  en  réalité,  caracté- 
ristique de  la  distribution  véritable.  Lorsqu'elle  est  com- 
plète, elle  montre  quel  est  le  type,  s'il  en  existe  un.  Si  l'on 
a  pu  contester,  dans  des  cas  spéciaux,  le  caractère  typique 
de  la  moyenne,  c'est  que  l'on  n'a  pas  toujours  eu  recours 
à  la  forme  de  moyenne  la  mieux  appropriée  à  la  recherche. 
Beaucoup  de  chercheurs  se  sont  bornés  à  l'emploi  de  la 
moyenne  arithmétique,  comme  si  les  moyennes  géomé- 
trique ou  harmonique,  la  médiane  et  la  dominante  (mode 
des  Anglais),  n'existaient  pas.  On  trouvera  plus  loin 
(Cfr.  n°  264)  la  démonstration  que  la  médiane,  par  exemple, 
convient  mieux  que  la  moyenne  arithmétique  à  l 'étude  de  la 
répartition  des  revenus  et  des  salaires.  Le  simple  bon  sens 
indique  que  le  mode  de  représentation  doit  être  choisi 
d'après  les  exigences  particulières  du  sujet  à  traiter. 

3°  Elle  sera  représentative,  c'est-à-clire  qu'elle  éveillera 
dans  l'esprit  du  chercheur  une  idée  générale  se  rapportant 
à  la  série  entière.  Si  l'expression  de  la  moyenne  est  pure- 
ment mathématique,  elle  ne  remplira  pas  entièrement 
l'office  qu'on  en  attend  et  il  faudra  donner  la  préférence 
à  une  formule  de  représentation  peut-être  moins  rigoureu- 
sement exacte,  mais  parlant  davantage  à  l'imagination. 

4°  La  stabilité  est  aussi  une  de  ses  qualités.  La  moyenne 
ne  peut  pas  subir  de  modifications  si  l'on  introduit,  dans. 
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la  série  d'où  elle  est  tirée,  de  légères  altérations,  soit  dans 
les  chiffres,  soit  dans  les  signes. 

5°  Il  faut  aussi  qu'elle  ne  présente  pas  de  difficultés  spé- 
ciales de  calcul.  C'est  pour  cette  raison  qu'on  est  amené 
fréquemment  à  donner  la  préférence  à  la  moyenne  arithmé- 
tique. Il  y  a  parfois  dans  ce  choix  une  part  d'exclusivisme 
non  justifiable.  Aucun  calcul  de  moyennes  ne  présente  de 
réelles  difficultés  de  calcul  et  il  ne  serait  pas  admissible 
d'arguer  de  prétendues  difficultés  pour  se  limiter  à  l'em- 
ploi d'une  formule  invariable;  le  genre  de  moyenne  doit 
être  choisi  d'après  des  considérations  propres  à  l'objet 
envisagé  et  au  but  à  atteindre. 

215.  La  notion  de  la  moyenne  est  double.  Au  point  de 
vue  mathématique,  la  moyenne  est  la  valeur  la  plus  pro- 
bable entre  toutes  celles  d'une  série  de  données  qu'on  peut 
ou  qu'on  doit  supposer  entachées  d'une  erreur  quelconque, 
même  légère.  On  peut  aussi  dire,  en  envisageant  plus  spé- 
cialement le  point  de  vue  des  probabilités,  que  la  moyenne 
converge,  à  mesure  que  le  nombre  d'éléments  à  comparer 
augmente,  vers  une  valeur  spéciale  et  fixe,  dépendant  de  la 
loi  de  probabilité  particulière  à  chaque  espèce  de  gran- 
deur (1).  Si  elle  n'exprime  pas  encore  la  vérité  absolue, 
que  nous  sommes  fréquemment  impuissants  à  déterminer, 
elle  en  est  au  moins  l'expression  la  plus  complète,  telle  que 
nous  pouvons  la  concevoir,  étant  donné  l'imperfection  de 
nos  sens  ou  de  nos  moyens  d'investigation. 

La  moyenne  joue  aussi  en  statistique  le  rôle  de  la  syn- 
thèse, l'intelligence  humaine  étant,  comme  on  l'a  dit,  natu- 
rellement portée  à  unifier  en  une  synthèse  plus  ou 
moins  compréhensive  les  impressions  quantitatives  diverses 
qu'elle  peut  recevoir  des  objets.  Les  séries  forment  déjà 


(1)  Cfr.  Boudin-Mansion,  loc.  cit.,  p.  144. 
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un  ensemble  où  viennent  se  confondre  de  nombreuses  don- 
nées. La  moyenne  est  une  sorte  de  commune  mesure,  une 
expression  idéale  qui  résume  tous  les  termes  du  problème. 
La  fonction  des  moyennes  est  d'exprimer  un  ensemble  com- 
plexe de  phénomènes  au  moyen  d'un  petit  nombre  de 
chiffres  simples. 

216.  Au  double  point  de  vue  qui  vient  d'être  résumé  cor- 
respondent deux  sortes  de  moyennes  :  la  moyenne  objective 
ou  réelle  et  la  moyenne  subjective  ou  idéale.  On  a  proposé 
également  de  donner  à  la  première  le  nom  de  moyenne 
typique  et  à  la  seconde  celui  de  moyenne  indice,  mais  cette 
distinction  n'a  pas  été  conservée  par  la  science;  l'expres- 
sion «  moyenne  typique  »  est  employée  par  l'école  contem- 
poraine pour  désigner  l'expression  numérique  qui  marque 
la  dispersion  de  la  série  (Cfr.  ch.  III)  et  il  convient  d'éviter 
toute  confusion  entre  cette  mesure  et  l'expression  synthé- 
tique cle  la  série,  qui  est  la  moyenne  à  proprement  parler. 

La  distinction  entre  la  moyenne  objective  et  la  moyenne 
subjective  n'est  pas  non  plus  universellement  adoptée. 
L'école  contemporaine  anglaise,  notamment,  en  fait  assez 
bon  marché  (1).  Cependant,  elle  répond  à  la  nature  des 
choses  et  mérite  de  retenir  quelques  instants  notre  atten- 
tion (-1). 

La  moyenne  objective  (ou  réelle)  est  celle  qui  résulte  des 
différentes  mesures  d'un  même  objet.  La  série  synthétisée 
par  la  moyenne  objective  est  formée  de  grandeurs  à  peu 
près  les  mêmes,  se  rapportant  toutes  à  un  objet  unique,  et 
dont  les  variations  ne  dépendent  que  de  faibles  erreurs 
commises  au  cours  de  l'observation  ou  de  modifications  lé- 


(1)  On 'n'en  trouve  trace,  notamment,  ni  clans  Venn,  ni  dans  Bowley,  ni 
dans  Yule;  Edgeworth,  dans  son  article  «  Average  »  du  dictionnaire  de 
Palgrave,  n'en  fait  pas  non  plus  mention.  Par  contre,  Stanley  Jevons  {l'rin- 
ciplefi  of  Science)  l'adopte  sans  contestation. 

(2)  On  trouvera  une  excellente  analyse  de  la  notion  des  moyennes  objec- 
tives et  subjectives  dans  Zizek  :  Rtatistical  Arerages,  pp.  10-13. 
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gères  survenues  pendant  l'observation  elle-même.  Un  cas 
classique  est  tiré  des  calculs  astronomiques  ayant  pour 
objet,  par  exemple,  la  détermination  de  l'ascension  droite 
d'un  astre.  On  pourrait  supposer  qu'une  observation  aussi 
usuelle  ne  prête  guère  à  erreur;  cependant,  Quetelet  qui, 
en  même  temps  que  statisticien,  était  astronome,  a  pris  soin 
de  nous  avertir  des  causes  nombreuses  d'erreur  qui 
existent  dans  l'astronomie  de  position  :  «  quelque  précis 
que  soit  l'instrument,  dit-il,  il  n'est  point  parfait  dans 
toutes  ses  parties;  quelles  que  soient  l'adresse  et  l'expé- 
rience de  l'observateur,  son  coup  d'œil  n'est  pas  infaillible  ; 
l'air  peut  être  dans  des  circonstances  plus  ou  moins  défavo- 
rables; nous  ne  voyons  les  astres  que  du  fond  de  l'at- 
mosphère dans  laquelle  nous  sommes  plongés  et,  à  cause 
des  réfractions,  ils  ne  sont  réellement  pas  dans  les  lieux  où 
nous  les  apercevons  (1).  »  Aussi  les  déterminations  de 
l'ascension  droite  de  la  polaire  faites,  au  nombre  do  487,  à 
l'observatoire  royal  de  Greenwich,  pendant  les  années 
1836  à  1839  inclusivement,  n 'ont-elles  pas  toutes  donné  des 
résultats  identiques.  En  combinant  ces  résultats,  on  déter- 
mine une  moyenne  objective  résultant  des  différentes  me- 
sures d'un  même  objet. 

Les  mesures  dont  on  tire  la  moyenne  objective  doivent, 
comme  dit  M.  Mansion,  leur  inégalité  à  leur  inexactitude. 
Ces  mesures  expérimentales  sont  nécessairement  liées  entre 
elles  par  une  loi  de  continuité  telle  qu'on  doit  admettre  que, 
s'il  n.'y  a  pas  de  cause  permanente  d'erreur,  il  y  a  autant 
de  chances  de  voir  se  produire  des  erreurs  en  plus  (posi- 
tives) et  des  erreurs  en  moins  (négatives).  La  courbe  de 
probabilité  prend,  dans  ce  cas,  une  forme  symétrique  par 
rapport  à  l'ordonnée  centrale  représentant  la  valeur  exacte, 
ou,  ce  qui  est  la  même  chose,  une  erreur  nulle  (2). 


(1)  Quetelet,  Lettres  sur  la  théorie  des  probabilités,  p.  124. 
sion,  loc.  cit.,  p.  148. 
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217.  A  cette  moyenne  s'oppose  la  moyenne  subjective  (ou 
idéale).  Elle  vient  des  diverses  mesures  se  rapportant,  non 
à  un  même  objet,  mais  à  plusieurs  objets  homogènes.  C'est 
la  véritable  moyenne  usitée  en  statistique,  particulièrement 
dans  la  statistique  sociale.  On  n'a  presque  jamais  à  recher- 
cher quelle  est  la  qualité  réellement  exacte  parmi  une  série 
de  grandeurs  observées-,  mais  on  a  très  fréquemment  à 
caractériser  par  une  expression  simple  une  série  plus  ou 
moins  étendue  de  mesures  se  rapportant  à  des  objets  mul- 
tiples, mais  homogènes.  Les  statistiques  de  salaires  four- 
nissent un  exemple  convenable  de  ce  genre  de  recherches. 
On  demande,  par  exemple,  quel  est  le  salaire  moyen  d'ou- 
vriers mâles  adultes  travaillant  dans  une  industrie  déter- 
minée, à  une  date  fixée  et  dans  un  endroit  indiqué.  Les 
objets  qui  sont  à  caractériser  ici  sont  les  salaires  effective- 
ment gagnés;  il  y  a  autant  d'observations  qu'il  y  a  de 
salaires,  et  ces  observations  seront  homogènes  si  l'on  a  pris 
soin  de  décider  qu'il  s'agit  d'une  certaine  catégorie  d'ou- 
vriers, observés  au  même  moment,  dans  un  même  lieu  et 
dans  une  industrie  nettement  déterminée.  Cette  quantité 
conventionnelle  sera  représentative  de  l'ensemble,  comme 
la  moyenne  objective  est  la  synthèse  des  diverses  observa- 
tions relatives  à  l'ascension  droite  de  l'astre  observé. 

218.  En  comparant  ces  deux  espèces  de  moyennes,  nous 
voyons  qu'elles  diffèrent  substantiellement.  La  moyenne 
objective  s'applique  à  un  seul  objet  qui  est  supposé  n'avoir 
subi  aucune  modification  essentielle  au  cours  de  l'observa- 
tion. En  conséquence,  les  différentes  mensurations  qui  ont 
été  faites  ne  diffèrent  entre  elles  que  par  leur  degré  de  pré- 
cision. Les  instruments  employés  n'ont  peut-être  pas  tou- 
jours fonctionné  d'une  manière  parfaite  et  les  écarts  autour 
de  la  moyenne  expriment  les  erreurs  dues  à  cette  cause; 
ou  bien,  l'observateur  n'a  pas  apporté  un  soin  égal  dans 
toutes  ses  vérifications,  et  alors  les  écarts  indiquent  un 
coefficient  d'erreur  personnelle;  ou,  ce  qui  est  le  cas  le  plus 
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fréquent,  les  deux  causes  d'erreur  coexistent  et  se  com- 
binent avec  une  troisième  ou  une  quatrième.  La  moyenne 
objective  a  pour  but  d'indiquer  quelle  est  la  dimension  vé- 
ritable de  l'objet  de  l'étude. 

Il  ne  peut  être  question  de  cela  dans  la  moyenne  subjec- 
tive. Les  objets  homogènes  qui  la  composent  sont  tous  dif- 
férents ;  leurs  dimensions  sont  supposées  connues  avec  toute 
l'exactitude  désirable,  mais  on  voudrait  obtenir,  par  le 
calcul,  une  mesure  commune  qui  les  synthétise,  de  façon  à 
remplacer  rémunération  de  la  série  par  une  expression 
abrégée.  Cette  expression  est  simplement  idéale  (de  là  le 
second  nom  sous  lequel  on  désigne  la  moyenne  subjective). 
Elle  n'exprime  aucun  caractère  de  grandeur  réelle  et  elle 
n'indique  pas  non  plus  la  gravité  de  l'erreur  provenant  soit 
de  l'observateur,  soit  de  l'instrument  d'observation:  sa 
portée  est  donc  essentiellement  synthétique  et  représen- 
tative (1). 

Les  deux  espèces  de  moyennes  diffèrent  encore  sous  le 
rapport  de  la  courbe  applicable  à  la  série.  La  moyenne 
objective  dérive  d'une  série  dont  le  développement  suit  de 
très  près  la  courbe  normale  des  erreurs.  Les  termes  peuvent 
être  considérés  comme  des  valeurs  empiriques  entachées 
d'erreurs  plus  ou  moins  grossières.  Dans  cette  conception, 
on  se  rapproche  de  la  théorie  de  Gauss,  dont  nous  avons 
déjà  dit  quelques  mots  plus  haut.  (Cfr.  n°  202.)  La  répar- 
tition des  erreurs  est  supposée  se  faire,  d'après  la  théorie 
mathématique,  conformément  à  l'expérience  et  à  la  raison, 
c'est-à-dire  que  les  erreurs  les  plus  graves  sont  les  moins 
nombreuses,  tandis  que  le  nombre  de  celles  ayant  peu  d'im- 


(1)  M.  Mansion,  loc.  cit.,  p.  149,  écrit  à  ce  propos  :  «  On  peut  faire 
avantageusement  usage  des  moyennes  arithmétiques  et  des  limites  entre 
lesquelles  sont  comprises  les  quantités  dont  elles  dérivent,  toutes  les  fois 
que  l'on  veut  restreindre  le  vague  d'une  expression  collective  et  lui  donner 
de  l'individualité;  mais  il  importe  de  ne  pas  perdre  de  vue  qu'il  ne  s'agit 
<[iie  d'une  simple  opération  de  calcul  entre  des  quantités  qui  n'ont  entre  elles 
aucune  relation  essentielle.  » 
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portance  augmente  progressivement.  En  général,  on  peut 
dire  que  la  distribution  des  termes  formant  la  moyenne 
objective  se  fait  d'après  la  formule  de  distribution  symé- 
trique. Au  contraire,  les  séries  d'observations  se  rapportant 
à  des  objets  différents  marquent  une  distribution  asymé- 
trique autour  de  la  moyenne. 

219-.  Nous  avons  défini  plus  haut  (Cfr.  n°  207)  le  carac- 
tère des  courbes  asymétriques  rappelant  plus  ou  moins  la 
courbe  de  Gauss,  nous  n'y  reviendrons  plus  ici.  Nous  nous 
bornerons  à  signaler  que  les  séries  de  mesures  se  rappor- 
tant à  plusieurs  objets  homogènes  appartiennent  à  cette 
espèce  de  courbes.  On  les  rencontre  en  très  grand  nombre 
dans  le  domaine  des  sciences  morales  et  politiques;  les 
exemples  appartenant  à  cette  série  de  questions  sont  pour 
ainsi  dire  inépuisables  (1).  On  sait  peut-être  moins  que  les 
sciences  naturelles  en  ont  fourni  aussi  de  nombreux  spéci- 
mens-. Au  cours  de  travaux  extrêmement  intéressants, 
qui  se  sont  multipliés  ces  dernières  années,  des  natura- 
listes et  des  botanistes  ont  prouvé  par  des  recherches  expé- 
rimentales, conduites  avec  une  grande  rigueur  scientifique, 
que  les  lois  de  variation  autour  de  la  moyenne  se  retrou- 
vaient, dans  une  certaine  mesure,  appliquées  dans  la  sphère 
des  phénomènes  biologiques  et  botaniques  (2).  Voici,  pour 
249  exemplaires  du  Pimpinella  Saxifraga  (variété  :  feuilles 
à  grandes  folioles),  observés  par  nous  à  Berg-lez-Tongres 
(Limbourg  belge)  au  mois  de  septembre  1916  (3),  la  répar- 


ti) Noue  en  avons  donné  quelques  spécimens,  accompagnés  de  graphiques, 
au  chapitre  précédent. 

(2)  On  en  trouvera  une  bibliographie  très  étendue  dans  l'ouvrage  de 
C.  B.  Davenport  déjà  cité  :  Statistical  methods,  pp.  85-104. 

(3)  Nous  sommes  redevables  de  la  détermination  de  cette  plante  à 
l'obligeance  de  M.  E.  De  Wildeman,  directeur  du  Jardin  botanique  de  l'Etat, 
à  Bruxelles,  à  qui  nous  sommes  heureux  d'adresser  nos  remerciements. 
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tition  des  ombelles  comptant  le  nombre  de  rayons  indiqués 
ci-dessous  (1)  : 


Exemple  1. 
Pimpinella  Saxifraga  L. 

(A.  Julin,  Berg,  Septembre  1916.) 


Nombre 
de  rayons 

Nombre  d'exemplaires 
possédant  le  nombre 
de  rayons  ci-contre 

Nombre 
de  rayons 

Nombre  d'exemplaires 
possédant  le  nombre 
de  rayons  ci-contre 

5 

1 

11 

61 

6 

5 

12 

29 

7 

9 

13 

14 

8 

22 

14 

4 

9 

38 

15 

4 

10 

62 

249 
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.   *  nombre  de.  ravons  de  l'ombelle  1 


Pimpinella  Saxifraga  L. 

Fia.  21. 

La  longueur  des  graines  de  caféier  donne  aussi  naissance 
à  une  courbe  asymétrique  dérivée  de  la  courbe  de  G-auss. 


(1)  Cfr.  les  expériences  portant  sur  le  Pimpinella  Saxifraga,  de  Ludwig  : 
«  Ueber  Variationskurven  und  VariationsfMelie  der  Pflanzen.  Botanisch- 
statistische  Untersuchungen.  (Botanisch  Gentralblatt,  Band.  LXIV,  n°  3, 
pp.  65-07.) 
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Voici  les  chiffres  obtenus  par  le  Dr  Cramer,  d'après  les 
graines  recueillies  sur  le  Liberia  Coffea  (1)  : 


Exemple  2.  —  Liberia  Coffea. 

(Dr  Cramer,  Indes  néerlandaises.) 


Longueur 

des  fèves 

Nombre  d'exemplaires 
ayant  les  dimensions 

Somme 
des 

'ongueurs  moyennes 

12 

—  12.5  millimètres  . 

1 

12.25 

12  5 

—  13 

»  ... 

4 

51  00 

13 

—  13.5 

»  ... 

7 

92.75 

13.5 

—  14 

»  ... 

19 

261.25 

14 

—  14.5 

»  ... 

27 

384.75 

14.5 

—  15 

»  ... 

47 

693  25 

15 

—  15.5 

»  ... 

54 

823.50 

15.5 

—  16 

»  ... 

45 

708.75 

16 

—  16.5 

»  ... 

26 . 

422.50 

16.5 

—  17 

»  ... 

15 

251 .25 

17 

—  17.5 

»  ... 

10 

172.50 

17.5 

—  18 

»  ... 

3 

53.25 

18 

—  18.5 

1 

18.25 

18.5 

-  19 

»  ... 

1 

18.75 

■260 

3,964.00 

ss 

r  ss 

\  «s 
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(  longueur  des  fèves  de  café  I 

Liberia  Coffea 

Fis.  22. 


(1)  Dr.  P.  I.  S.  Cramer,  Mededeelingen  uitgaande  van  het  Département 
van  Landbouw,  n°  11.  Gegevens  over  de  variabiliteit  van  de  in  Nederlandsch- 
Indië  verbouwde  koffiesoorten.  Kolff  &  C°,  Batavia,  1913,  p.  40. 
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Lndwig,  dans  son  travail  sur  les  courbes  et  surfaces  de 
variation  des  plantes,  cité  plus  haut  (cfr.  p.  358,  note  1), 
a  fait  de  très  nombreuses  expériences  sur  une  série  de  végé- 
taux; les  courbes  qu'il  a  tracées  présentent  parfois  plu- 
sieurs «  modes  »  (1)  ;  c'est  le  cas,  notamment,  pour  le 
Pimpinella  saxifraga  L.,  qué  l'auteur  a  analysé,  mais  la 
réunion  de  certains  résultats  fragmentaires  permet  la  con- 
struction d'une  vraie  courbe  asymétrique.  Ludwig  a 
trouvé  pour  cette  plante  des  courbes  comprenant  plusieurs 
modes,  mais  en  les  réunissant  il  en  a  tracé  une  nouvelle 
où  les  deux  sommets  primitifs  existaient  encore,  mais  où,  en 
même  temps,  la  dépression  intermédiaire  est  remplacée  par 
un  large  plateau  aux  points  10  et  11.  Ce  résultat  est  d'ac- 
cord avec  celui  auquel  nous  sommes  arrivé  (2). 

220.  La  classification  des  moyennes  peut  aussi  se  faire 
d'après  la  façon  de  les  calculer.  C'est  même  la  classification 
la  plus  connue  du  grand  public;  les  traités  d'algèbre  et  la 
pratique  ont  rendu  familières  à  chacun  les  notions  de  : 
moyenne  arithmétique,  moyenne  géométrique,  moyenne  har- 
monique. On  connaît  moins  la  moyenne  anti-harmonique  et 
les  propriétés  réciproques  que  montrent  les  moyennes  les 
unes  à  l'égard  des  autres.  Bien  que  les  moyennes  dont  nous 
faisons  usage  soient  très  peu  nombreuses,  nous  savons 
qu'en  réalité  il  n'y  a  pas  de  limites  dans  cette  direction; 
on  peut,  en  effet,  imaginer  des  valeurs  moyennes-  de  formes 
diverses  et  en  nombre  considérable  (3). 

On  fait  remonter  à  Pythagore  l'introduction  des  trois 
moyennes  classiques  :  l'arithmétique,  la  géométrique  et 
l'harmonique.  Boëtius  en  avait  proposé  trois  autres  qui 
étaient  le  contraire  de  la  géométrique  et  de  l'harmonique, 


(1)  Sur  le  sens  de  cette  expression,  cfr.  p.  333,  note  2. 

(2)  Ludwig,  îoc.  cit.,  et  de  Bruycker,  De  statistische  méthode  in  de  plant- 
humde.  Gent,  Siffer,  1910,  p.  57.  .  . 

(3)  Messedaglia,  «  Calcul  des  valeurs  moyennes  »  (Annales  de  démogra- 
phie internationale,  4e  année  (1880),  p.  388). 
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et  puis,  finalement,  quatre  nouvelles.  Le  mathématicien 
Jordanus  (fin  du  xrT  siècle)  en  ajouta  même  une  onzième  (1). 

L'accord  s'est  fait  pour  ne  pas  encombrer  inutilement  la 
pratique  de  formules  trop  compliquées  ou  ne  présentant 
qu'un  simple  intérêt  théorique.  Aujourd'hui,  les  statisticiens 
se  bornent,  en  général,  à  utiliser  les  moyennes  classiques; 
leur  importance,  comme  leur  valeur  pratique,  peut  être 
exprimée  dans  cet  ordre  :  en  tête,  la  moyenne  arithmétique  ; 
en  second  lieu,  la  moyenne  géométrique  ;  enfin,  la  moyenne 
harmonique  ;  la  moyenne  contre-harmonique  et  la  moyenne 
quadratique  jouent  un  rôle  spécial.  Aux  moyennes  clas- 
siques on  a  ajouté,  à  une  époque  relativement  récente,  deux 
expressions  synthétiques  nouvelles  :  la  médiane  et  la  domi- 
nante, dont  nous  parlerons  plus  loin.  (Cfr.  même  cha- 
pitre, VI  et  VIL) 

221.  La  moyenne  arithmétique  s'écrit  au  moyen  de  for- 
mules diverses,  dont  voici  les  principales  (2)  : 

M  _  gi  +  fl2  +  «3  +  •■■  4-  an  (8) 

formule  dans  laquelle  M  =,  la  moyenne;  a1}  a2,  as...  an 
les  termes  de  la  série  de  laquelle  dérive  la  moyenne;  n,  le 
nombre  de  termes  de  la  série. 

On  peut  aussi  écrire  : 

M  =  i(X1+X,  +  X3+...  +  Xn)  (9) 

formule  où  l'on  peut  remplacer  la  succession  des  X  par  le 
symbole  v  qui  désigne  la  somme  des  quantités  de  la  série, 
de  sorte  que  l'on  a  : 

M  =  -i  s  (X)  (10) 


(1)  Stanley  Jevons,  The  Principles  of  Science.  London,  1892,  p.  360. 

(2)  Nous  employerons  la  lettre  M  pour  désigner  la  moyenne;  les  Anglais 
et  les  Américains  font  souvent  usage  de  la  lettre  A  (average).  Les  chiffres 
entre  parenthèses  qui  suivent  la  formule  indiquent  le  n°  d'ordre  de  celle-ci. 
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Lorsque  la  moyenne  est  calculée  sur  une  série  composée 
de  classes  différentes  ayant  chacune  leur  fréquence  propre 
(par  exemple,  des  taux  de  salaires  gagnés  par  des  ouvriers 
en  nombre  variable),  la  formule  de  la  moyenne  est  : 

M  =  l2(/'.  x)  (11) 

où  /  signifie  la  fréquence  et  x  la  valeur  de  la  classe, 
pratiquement  la  demi-valeur  des  deux  limites  extrêmes 
(1.25  fr.  à  1.50  fr.  =  1.375  fr.). 

La  moyenne  géométrique  est  également  d'un  usage  cou- 
rant, quoiqu'elle  soit  moins  fréquemment  employée  que  la 
moyenne  arithmétique.  Nous  la  désignons  par  la  lettre  G. 

On  l'écrit  : 

n   

G  =        .  a2  .  .  .  an  (12) 

ou  encore  : 

G  =  (Xi  .  X2  .  X3 .  .  .  Xn)  n  (M) 

La  recherche  s 'effectuant  au  moyen  des  logarithmes,  on 
peut  aussi  avoir  : 

log.  G  =  ^  s  (log.  X)  (14) 

d'où  il  résulte  que  le  logarithme  de  la  moyenne  géométrique 
d 'une  série  de  valeurs  est  la  moyenne  arithmétique  de  leurs 
logarithmes. 

La  moyenne  harmonique  est  d'un  emploi  peu  fréquent. 
Nous  la  désignons  au  moyen  de  la  lettre  H. 
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Ou  encore,  quand  on  envisage  le  cas  de  deux  valeurs  seu- 
lement : 

H  _  2  fa  +  a8)  (16) 
ai  +  a2 

formule  identique  à  (15). 

La  moyenne  contre-harmonique  (CH)  a  pour  formule  gé- 
nérale : 

CH  =  'i'  +  q,»  +  q3»+-.  +  fln«  (17) 

«i  +  «2  +  «3  +  •••  +  an 
La  moyenne  quadratique  (M2)  s'exprime  par  la  formule  : 
M2  =  (  y/  gi2  +  fl22  +  «32  4-  —  flw'j  (18) 

222.  Avant  d'exposer  les  caractères  de  chacune  de  ces 
moyennes,  nous  ferons  une  brève  application  du  calcul  aux 
nombres  :  34,  38,  42,  46,  afin  de  familiariser  le  lecteur  avec 
l'emploi  des  formules.  En  regard  du  calcul  se  trouve,  entre 
parenthèses,  le  numéro  de  la  formule  employée. 

34  _i_  38  4-  42  4-  46  160 
M  =       h  °T  =  =^  =  40  (8) 

4  4  w 

Admettons  que  ces  données  soient  affectées  des  poids  : 
4,  3,  2,  1.5. 

Nous  avons  : 

M  -   34  x  4  +  38  x  3  +  42  x  2  +  46  x  1.5  _  136  +  114+84+69 
10.5  ~  10.5 

=  m  =  38,381  (10) 

La  moyenne  géométrique  de  ces  nombres  s'exprime  par  la 
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moyenne  de  leurs  logarithmes  ramenée  à  son  nombre  na- 
turel : 

r      1.53147892  +  1.57978360  +  1.62324929  +  1,66275783 
 — |  

6.39726964 


1.59931741  =  39,750  (14) 

La  moyenne  harmonique  des  mêmes  chiffres  est  : 

1 


H 


0.029411765  -f  0.026315789  +  0.023809524  +  0.021739130 


4 

1 


=  39,498  (15) 


0.025319052 

Leur  moyenne  contre-harmonique  est  : 

r  il  1156  +  1444  +  1764  +  2116  6480  _  „ 
Lli  =         34  +  38  +  42  +46        ~  1W  ~  4U'5 

Enfin,  leur  moyenne  quadratique  est  : 

M2  =  |^/1156  +  1444  +  1764  +  2116  =  |^/648Û 

=  VÎ620  =  40,2492236  (18) 


Indépendamment  de  ces  moyennes,  il  y  a  lieu  de  men- 
tionner la  médiane  et  la  dominante  (ou  mode),  qui  sont  des- 
moyennes  de  position.  Ces  deux  moyennes  sont  d'un  usage 
récent.  Elles  ont  été  mises  en  évidence  principalement  par 
l'école  statistique  anglaise.  Un  paragraphe  spécial  est  ré- 
servé à  chacune  d'elles  à  la  fin  de  ce  chapitre. 

223.  La  classification  des  moyennes  d'après  le  mode  de 
calcul  qui  leur  est  applicable  est  adoptée  généralement.  Ce- 
pendant, il  y  a  lieu  de  signaler  un  classement  différent  pro- 
posé par  Fechner  (1).  Cet  auteur  divisait  les  moyennes  en 
trois  groupes  : 


(1)  Fkchnee,  Kollektivmasslefore  et  TJéber  den  Ausgangswert  der  Kleinsten 
Abiveichungssumme,  pp.  75  et  37. 
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1°  Celles  constituées  par  une  valeur  telle  que  la 
somme  absolue  des  carrés  des  écarts  à  la  moyenne  est  un 
minimum  par  rapport  à  celle-ci.  La  moyenne  arithmétique 
appartient  à  ce  type  ; 

2°  Le  groupe  de  moyennes  constitué  par  celles  de  la 
forme 


équation  dans  laquelle  n  indique  la  puissance,  1  la  somme 
des  termes  de  la  série,  a  les  termes,  m  le  nombre  de  ces 
termes  ;  la  moyenne  quadratique  appartient  au  second  ordre 
de  ce  groupe 

3°  Enfin,  les  moyennes  de  combinaison. 

Cette  classification,  d'essence  mathématique  plutôt  que 
statistique,  n'a  jjas  détrôné  la  première. 


224.  La  moyenne  arithmétique  est  à  la  fois  la  plus  usitée 
et,  dans  de  nombreux  cas,  la  plus  sûre  de  toutes  les  expres- 
sions synthétiques  employées  pour  caractériser  une  série. 

On  la  divise  en  moyenne  arithmétique  simple  et  en 
moyenne  arithmétique  composée  ou  pondérée.  En  réalité, 
il  n'y  a  pas  de  distinction  essentielle  entre  ces  deux  formes  ; 
la  règle  appliquée  est  la  même  dans  les  deux  cas,  elle  ne 
diffère  que  par  une  simple  modalité.  Dans  la  moyenne 
arithmétique  simple,  chaque  terme  peut  être  considéré  en 
lui-même,  tandis  que  dans  la  moyenne  pondérée,  il  y  a  lieu 
d'observer  leur  fréquence,  ce  qui  oblige  nécessairement  à 
tenir  compte  des  «  poids  »  dans  le  calcul.  Ainsi,  dans  une 
brasserie,  on  produit  X  hectolitres  de  bière  par  an;  la 
moyenne  de  la  production  par  semaine  (si  l'on  a  travaillé 

chaque  semaine)  sera    —,  moyenne  arithmétique  simple; 

pour  la  valeur  moyenne  de  l'hectolitre,  on  sera  obligé  de 


(19) 


II.  —  La  moyenne  arithmétique. 
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tenir  compte  des  quantités  de  bière  qui  ont  été  vendues  à 
différents  prix  :  soit  X3,  X2,  X3  ces  quantités  et  vx,  v2,  v3 
les  prix,  on  a  : 

X|  x  ?»j  +  X,  x  r 2  +  X3  x  v3  (11) 

X,  +  x2  +  x3 

moyenne  arithmétique  pondérée. 

La  règle  de  la  moyenne  arithmétique  est  fondée  sur  le 
principe  de  compensation  équitable.  «  Dans  les  faits 
qu'étudie  la  statistique,  a  écrit  M.  Lucien  Mardi  dans  un 
remarquable  travail  (1),  toute  vue  générale  implique  l'hypo- 
thèse que  des  changements  survenus  dans  les  circonstances 
nombreuses  qui  gouvernent  les  phénomènes,  la  plupart  sont 
assez  faibles  ou  se  compensent  suffisamment  pour  ne  point 
altérer  sensiblement  le  résultat  d'une  observation  éclai- 
rée. »  Ainsi,  d'après  le  même  auteur,  «  le  principe  de  com- 
pensation sur  lequel  est  basée  toute  comparaison  de  faits 
collectifs,  n'est  que  la  généralisation  de  la  formule  d'un 
marché  équitable  que  les  hommes  ont  sans  doute  adoptée 
depuis  qu'ils  vivent  en  société.  La  règle  de  la  moyenne  qui, 
du  point  de  vue  logique,  est  fondée  sur  une  extension  du 
principe  de  raison  suffisante  traduit  cette  formule  (2).  » 

Il  en  résulte  que  «  la  moyenne  arithmétique  ou,  plus  briè- 
vement, la  moyenne  de  n  quantités  est  la  grandeur  qui, 
répétée  n  fois,  fournit  le  total  de  n  quantités  »  (3). 

225.  La  moyenne  arithmétique  s'obtient  en  divisant  la 
somme  des  termes  par  le  nombre  des  termes.  Eappelons  son 
expression  générale  : 

M  =  gi  +  fl2  +  «3  +  •••  +  a"  (g) 
n 

Elle  est  d'un  usage  extrêmement  fréquent. 


(1)  Lucien  Mahch  :  «  Essai  sur  un  modo  d'exposer  les  principaux  éléments 
de  la  théorie  statistique  ».'  (Journal  de  la  Société  de  statistique  de  Paris, 
51e  année,  1910,  pp.  447-480.) 

(2)  Lucien  March,  loc.  cit.,  p.  448. 

(3)  Id.,  loc.  cit.,  p.  449. 
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Les  observations  hebdomadaires  faites  à  l'aide  des  ther- 
momètres, dans  les  observatoires,  sont,  par  exemple,  ré- 
duites en  moyenne  mensuelle.  A  l'observatoire  d'Edim- 
bourg, les  lectures  faites  à  l'un  des  thermomètres  (t)  ont 
donné,  en  janvier  1899,  les  résultats  suivants  :  47.50  — 
47.49  —  47.43  —  47.36  —  47.32  (1).  D'où  la  moyenne  men- 
suelle pour  janvier  1899  : 

M    _  47.50  +  47.49  +  47.43  +  47.36  +  47.3g  _  , 

Les  moyennes  sont  nécessaires  en  démographie  pour 
apprécier  les  variations  qui,  d'une  période  à  l'autre, 
s'observent  dans  les  phénomènes.  Voici,  par  exemple,  le 
nombre  de  mariages  contractés  en  Angleterre  et  clans  le 
pays  de  Galles,  pendant  la  période  décennale  1891-1900  (g)  : 


Exemple  3.  —  Mariages  en  Angleterre  et  dans  le  pays  de  Galles 

(1891-1900). 


Années. 

Nombre 
de  mariages. 

Années. 

Nombre 
de  mariages. 

1891 

226,526 

1896 

242,764 

1892 

227,135 

1897 

249,145 

1893 

218,689 

1898 

255,379 

1894 

226,449 

1899 

262,334 

1895 

228,204 

1900 

257,480 

D 'après  la  formule  : 

M  =  i  2  (X)  (10) 


nous  avons  : 

M  =  |3W0S=m4106 


(1)  «  Observations  of  the  Edinburgh  Rock  Thermometers  »,  by  Thomas 
Heath,  B.  A.,  Assistant  Astronomer.  (Transactions  of  thc  Royal  Society 
of  Edinburgh,  t.  40,  1000-1901,  p.  169.) 

(2)  Statistique  internationale  du  mouvement  de  la  population.  Paris, 
Imprimerie  Nationale,  1907,  pp.  2-3. 
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226.  La  formule  de  la  moyenne  composée  ou  pondérée  ne 
diffère  pas  de  celle  de  la  moyenne  arithmétique  simple,  sauf 
qu'ici  il  faut  nécessairement  tenir  compte  de  l'importance 
respective  de&  termes.  La  moyenne  pondérée  est  très  fré- 
quente dans  les  recherches  relevant  de  l'ordre  social  ou 
économique. 

Un  cas  classique  de  l'emploi  de  cette  moyenne  se  trouve 
dans  la  formation  des  index-numbers  de  prix  (1).  Si  l'on 
veut  évaluer  les  variations  générales  de  l'ensemble  des  prix, 
à  une  époque  donnée,  il  convient  non  seulement  de  réunir 
des  renseignements  sûrs  concernant  un  grand  nombre 
d 'articles',  mais  il  faut,  de  plus,  attribuer  à  chaque 
article  un  «  poids  »  en  rapport  avec  l'importance  qu'il  a 
dans  l'ensemble  des  marchandises  considérées.  Pour  obtenir 
ce  résultat,  on  donne  à  chaque  denrée  une  cote  et  on  mul- 
tiplie les  prix  par  cette  cote. 

Les  Index-Numbers  dressés  par  la  Commission  des 
Finances  du  Sénat  des  Etats- Unis-  d'Amérique  ont  été  cal- 
culés d'après  trois  méthodes  dont  deux  sont  basées  sur  la 
moyenne  arithmétique  pondérée.  Les  «  poids  »  sont  pro- 
portionnés à  l'importance  de  la  consommation  parmi  2,561 
familles  normales  dont  les  dépenses  ont  été  relevées  au 
moyen  de  budgets.  Par  rapport  à  10,000,  les  dépense»  re- 
présentent, par  catégories  d'articles,  les  chiffres  propor- 
tionnels ci-après  :  loyer  :  1,506  ;  nourriture  :  4,103  ;  chauf- 
fage :  500;  vêtement  :  1,531;  éclairage  :  90;  autres  dé- 
penses :  2,270  (2). 


(1)  On  appelle  «  Index-Numbers  »,  un  système  dans  lequel  les  prix  d'un 
certain  nombre  de  marchandises  considérées  comme  représentatives  de  l'en- 
semble des  transactions  sont  relevés  et  représentés  par  l'unité;  une  année  ou 
une  moyenne  d'années,  ayant  été  prise  comme  base  de  comparaison,  les 
variations  des  prix  les  années  suivantes  s'expriment  par  pourcentages  cal- 
culés sur  les  prix  de  la  première  année. 

(2)  U.  S.  Department  of  Labor.  Bureau  of  Labor  Statistics.  Numbers  of 
wholesale  priées  in  the  United  States  and  foreign  countries,  July  1010, 
Washington. 
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Par  rapport  à  l'année  de  base  (1860  =  100)  les  chiffres 
de  l'Index  en  1891  donnent  les  résultats  consignés  à  la  se- 
conde colonne.  La  moyenne  proportionnée  ou  pondérée  se 
calcule  donc  comme  suit  : 


Exemple  4.  —  Période  de  base  :  1860  =  100. 


Importance 

Nombre- 
Index  en  1891 

liesuitiits 

1,506 

100,0 

1,506,000 

4,103 

103.7 

4,254,811 

Chauffage  .... 

500 

98,1 

490,500 

90 

48,1 

43,290 

1,531 

„  75.1 

1,162  029 

Autres  dépenses 

2,270 

95.3 

2  164,096 

Totaux. 

10,000 

96,2 

9,620,726 

Représentant  par  p0  les  prix  une  année  prise  comme  base, 
par  pg.  les  prix  les  autres  années,  par  g  les  quantités  phy- 
siques admises  comme  poids,  et  établissant  les  relations 
entre  les  prix  et  les  quantités  chaque  année  par  rapport  à 
l'année  de  base,  on  a  : 


y*  .  g  +  y',  .  g'  +  +  g|  .  g'1 

p0  .  g  4-  p'o  ■  q'  +  +  Vo  •  <T 

227.  Dans  l'exemple  précédent,  la  moyenne  est  multi- 
pliée par  un  nombre  entier  exprimé  par  un  seul  chiffre, 
mais  il  arrive  souvent  que  la  classe  des  données  est 
comprise  entre  deux  chiffres  limites;  tel  est  le  cas  qui 
se  présente  dans  les  statistiques  de  salaires  où  *  des 
nombres  donnés  d'ouvriers  gagnent  un  salaire  com- 
pris entre  telle  somme  et  telle  autre.  Dans  ce  cas,  on  adopte, 
comme  représentant  la  classe,  le  chiffre  intermédiaire  entre 
les  deux  limites,  dans  l'hypothèse  que  la  répartition  des 
unités  se  fasse  d'une  manière  égale. 


24 
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Voici  un  exemple  emprunté  à  la  statistique  des  salaires 
dans  les  industries  des  métaux,  publié  par  l'Office  du  Tra- 
vail de  Belgique  (1)  : 


Exemple  5.  —  BELGIQUE.  -  Salaires  des  ouvriers  mâles  adultes 
dans  les  ateliers  de  robinetterie.  (Octobre  1903.) 


XctUA    Uco    bcuclll  ca 

Taux 
intermédiaire 

Nombre 
d'ouvriers 

Montant 
des  salaires 

Francs. 

Francs. 

1.50  à  1.74 

1,625 

17 

27.62 

1.75  à  1.99 

1,875 

3 

5.62 

2.00  à  2.24 

2,125 

10 

21.25 

2  25  à  2.49 

2,375 

8 

19.00 

2  50  à  2  74 

2,625 

34 

89.25 

2.75  à  2.99 

2,875 

28 

80.50 

3.00  à  3.24 

3,125 

34 

106.25 

3.25  à  3.49 

3,375 

26 

87.75 

3.50  à  3.74 

3,625 

47 

170.37 

3.75  â  3  99 

3,875 

44 

170.50 

4.00  à  4.24 

4,125 

60 

247.50 

4.25  à  4.49 

4,375 

24 

104  90 

4.50  à  4.74 

4,625 

27 

124.87 

4.75  à  4.99 

4,875 

9 

43.87 

5.00  à  5.24 

5,125 

22 

112.75 

5.25  à  5  49 

5,375 

8 

43.00 

5.50  à  5.74 

5.625 

5 

28.12 

5  75  à  5  99 

5,875 

13 

76.37 

6.00  à  6.24 

6,125 

8 

49.00 

6.25  à  6.49 

6,375 

o 

12.75 

6.50  à  6.74 

6,625 

1 

6.62 

6  75  à  6.79 

6,875 

3 

20.62 

433 

1,648.48 

(1)  Koyaume  de  Belgique.  Office  du  travail.  Statistique  des  salaires  dans 
les  industries  des  métaux  au  mois  d'octobre  1908.  Bruxelles,  1907,  p.  647. 
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Le  tableau  précédent  présente  le&  résultats  numériques 
de  la  formule  : 


M  -  fl  S  (/'.  x) 


fil) 


d'après  laquelle  : 

1.025  X  17  +  1,875  x  3  +  + 

433 


1,648.48 
433 


=  fr.  3,807. 


228.  La  même  formule  est  employée  pour  le  calcul  des 
caractères  de  variabilité  en  botanique.  Calculons  le  nombre 
moyen  d'ombellules  pour  les  249  exemplaires  du  Pimpinella 
saxifraga  L.  que  nous  avons  analysés  et  dont  nous  avons 
reproduit  plus  haut  (cfr.  n°  219)  la  courbe  caractéristique. 

Exemple  6  — Pimpinella  saxifraga  L. 

Nombre  moyen  de  rayons 


Classement 
d'après  le  nombre 
de  rayons 

Nombre  d'exemplaires 
possédant  le  nombre 
rie  rayons  ci-contre 

Nombre  total 
de  rayons 

5 

1 

5 

6 

5 

30 

7 

9 

63 

8 

22 

176 

9 

38 

342 

10 

62 

620 

11 

61 

671 

12 

29 

348 

13 

14 

182 

14 

4 

56 

15 

4 

60 

249 

2,553 

5x1  +  6x5  +  7x9  +  + 


249 
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229.  Il  existe  une  autre  méthode,  pour  calculer  la  moyenne 
arithmétique,  qu'on  peut  désigner  sous  le  nom  de  méthode 
abrégée  ou  de  méthode  indirecte.  Elle  est  fondée  sur  cette 
propriété  remarquable  des  moyennes  d'après  laquelle  la 
somme  algébrique  des  écarts  à  la  moyenne  est  égale  à  zéro. 
(Cfr.  plus  loin  V,  propriétés  mathématiques  des  moyennes, 
n°  246)  (1). 

Appelons  A  la  valeur  choisie  d'une  manière  arbitraire, 
M  la  moyenne,  l  l'écart  entre  A  et  M.  Nous  pouvons 
écrire  (2) 

M  =  A  +  Z  (20) 

Si  /  désigne  le  nombre  de  fréquences,  x  les  valeurs  de 
chaque  classe,  nous  avons  : 

2  (f.x)  =  2  (/'.A)  +2  (f.l) 
et  puisque  A  est  une  valeur  constante  : 

M  =  A  +  is(f.I)  (21) 

au  lieu  de  calculer  2  (/'.  x),  on  calcule  donc  2  (/.  I). 

L'avantage  de  la  méthode  consiste  en  ce  que  les  fré- 
quences doivent  être  multipliées  seulement  par  des  nombres 
peu  importants,  donc  faciles  à  calculer;  en  prenant  leur 
origine  0  à  la  classe  choisie  d'une  manière  arbitraire,  ils 
ne  s 'élèvent  qu  'à  quelques  unités  correspondant  au  nombre 
de  classes  au-dessus  et  au-dessous  de  la  valeur  arbitraire. 
Pour  rendre  ce  nombre  aussi  petit  que  possible,  on  a  soin  de 
prendre  comme  point  d'origine  une  valeur  située  vers  le 
milieu  de  la  série. 

La  règle  peut  être  formulée  comme  suit  :  la  moyenne 
arithmétique  simple  d'une  série  de  termes  peut  être  trouvée 
en  admettant  qu'une  valeur  arbitrairement  choisie  est  la 


(1)  Cfr.  sur  ce  point  King  (W.)  :  The  éléments  of  staiistical  mctliods,  New- 
York,  1912,  pp.  134-136,  et  Yule  (U.  G.)  :  An  introduction  to  the  theory  of 
statistics,  London,  1011,  pp.  110-113. 

(2)  Cfr.  Udny  Yule,  loc  cit.,  p.  110. 
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moyenne  exacte;  calculez  alors  la  somme  algébrique  des 
écarts  de  chacun  des  termes  par  rapport  à  la  moyenne  sup- 
posée; divisez  cette  somme  par  le  nombre  de  termes  et 
ajoutez  le  quotient  au  chiffre  de  la  moyenne  arbitrairement 
choisie.  Le  résultat  donne  la  valeur  de  la  moyenne  exacte. 

Faisons  application  de  cette  méthode  à  l'exemple  3. 
(Cfr.  n°  225.) 


Exemple  7.  —  Nombre  moyen  de  mariages  de  1891  à  1900 
en  Angleterre  et  dans  le  pays  de  Galles. 


Années. 

Termes 
de  la  série. 

Moyenne 
arbitraire. 

Écarts  de  chaque 
terme  à  la  moyenne 
arbitraire. 

1891  .... 

226,526 

—  13,474 

1892  .... 

227,13,-) 

—  12,865 

1893    .  . 

218.689 

—  21,311 

1894    .    ,    .  . 

226,449  1 

—  13,551 

1895    .    .  . 

228,204 

>  240.000 

—  11,796 

1896  .... 

242,764  I 

+  2,764 

1897   

249,145 

+  9,145 

1898    .    .    .  . 

255,379 

+  15,379 

1899  .... 

262,334 

+  22,334 

1900  .... 

257,480 

+  17,480 

v=_  5^95 

—  5,895  : 

10  =  -  589.5 

240,000  +  (-  589.5)  =  239,410.5 

Ce  chiffre  exprime  la  moyenne  arithmétique  exacte,  telle 
qu'elle  a  été  calculée  plus  haut. 

230.  Pour  la  moyenne  arithmétique  composée,  la  règle 
est  différente  :  choisissez  une  classe  des  variables  comme 
renfermant,  par  hypothèse,  la  moyenne  et  désignez  cette 
classe  par  0;  attribuez  ensuite  aux  classes  supérieures  et 
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inférieures  un  numéro  d'ordre  en  partant  de  la  classe  0; 
multipliez  les  fréquences  par  ce  chiffre  en  attribuant  au 
produit  une  valeur  positive  lorsque  sa  classe  est  supé- 
rieure, une  valeur  négative  lorsque  sa  classe  est  inférieure 
à  celle  choisie  par  hypothèse.  Faites  la  différence  des  deux 
produits;  le  reste  forme  le  numérateur  d'une  fraction  dont 
le  dénominateur  est  le  nombre  de  fréquences;  réduisez  la 
fraction,  en  tenant  compte  de  l'intervalle  de  la  classe  et 
ajoutez  le  quotient  avec  son  signe  à  la  moyenne  supposée  : 
le  total  est  la  moyenne  véritable. 

Traitons  par  cette  méthode  les  données  de  l'exemple  5. 

Supposons,  par  hypothèse,  que  la  moyenne  est  comprise 
dans  la  classe  fr.  3.50  à  3.74.  Nous  disposons-  les  calculs 
comme  suit  : 
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Exemples.  —  BELGIQUE.  —  Salaires  des  ouvriers  mâles  adultes 
dans  les  ateliers  de  robinetterie.  (Octobre  1903  ) 


Classes  des  salaires 

Fréquences 
(f) 

Ecarts 
(b) 

Produits 
if  h) 

Francs. 

1,625 

17 

—  8 

136 

1,875 

3 

—  7 

21 

2,125 

10 

—  6 

60 

2,375 

8 

—  5 

40 

2,625 

34 

—  4 

136 

2,875 

-28 

—  3 

84 

3,125 

34 

  2 

68 

3,375 

26 

—  1 

26 

3,625 

47 

0  (A) 

—  571 

3,875 

44 

+  1 

44 

4,125 

60 

4-  2 

120 

4,375 

24 

+  3 

72 

4,625 

27 

+  4 

108 

4,875 

9 

+  5 

45 

5,125 

22 

.  +  6 

132 

5,375 

8 

+  7 

56 

5,625 

5 

+  8 

40 

^  87^ 

l  o 

+  y 

1 17 

6,125 

8 

+  10 

80 

6,375 

2 

+  11 

22 

6,625 

1 

+12 

12 

6,875 

3 

+13 

39 

433 

+  887  . 

£  (f.  b)  =  +  887  —  571  =  +  316 
316  729 

M  —  A(*)  =  +  |^g  =  +  ^  qqq  ou  +  0,182  (en  tenant  compte  de 

l'intervalle  (0.25)  de  la  classe). 

M  =  3,625  +  0,182  =  3,807.  (Cfi\,  n°  227.) 
(1)  A  est  la  valeur  choisie  arbitrairement  comme  représentant  la  moyenne. 
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Cette  méthode  étant  importante,  nous  en  faisons  une  nou- 
velle application  à  notre  exemple  6,  où  la  moyenne  arithmé- 
tique se  fixe  par  le  procédé  ordinaire  à  10.253.  (Cfr.  n°  228.) 


Supposons  que  la  moyenne  se 

trouve  dans  la  classe  11  : 

Exemple  9.  —  Pimpinella  Saxifraga  L. 

Nombre  moyen  de  rayons 

Classes  par  rayons 

Fréquences 
(f) 

Ecarts 
(b) 

Produits 
(f  b) 

5 

1 

—  6 

—  6 

H 

5 

—  5 

—  25 

7 

9 

—  4 

—  36 

8 

22 

—  3 

—  66 

9 

38 

—  2 

—  76 

10 

62 

—  1 

—  62 

11 

61 

0  (A) 

—  271 

12 

29 

4-  i 

29 

13 

14 

+  2 

28 

14 

4 

+  3 

12 

15 

4 

.+  4 

16 

249 

+  85 

v  (f.  b)  =  _  271  +85: 
186 


186 


M-A=-M9"0-747 
M  =  11  -f  (-0.747)  =  10.253 

Dans  la  réduction  de  la  fraction,  nous  n'avons  pas  dû 
transformer  le  quotient,  l'intervalle  de  classe  étant,  dans 
ce  cas-ci,  égal  à  l'unité. 

23.1.  Il  est  clair  que  si  la  position  de  la  moyenne  hypo- 
thétique est  modifiée,  tous  les  calculs  changent,  mais  le 
résultat  reste  le  même.  Ludwig  (1)  a  trouvé  des  courbes  de 
Pimpinella  saxifraga  L  dont  l'optimum  était  à  8;  adoptons 


(1)  Li  nwiG:  TJeber  V.ariationskwven  and  Variationsflàclien,  etc..  pp.  fi.Vt57. 
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ce  chiffre  comme  moyenne  hypothétique.  Les  calculs  se  dis- 
posent comme  suit  : 

Exemple  10.  —  Pimpinella  Saxifraga  L. 

Nombre  moyen  de  rayons 


Classes  par  rayons 


Fréquences 

(f) 


Ecarts 
(b) 


Produit 
(f.  b) 


S 
6 
7 
8 
9 
10 
11 
12 
13 
14 
15 


1 

5 
9 
22 
38 
62 
61 
29 
14 
4 
4 


249 


—  3 

  2 

—  1 
0 

+  1 

+  2 
+  3 

4  4 

+  5 
+  « 
+  7 


3 
10 

9 


22 


38 
124 
183 
116 
70 
24 

9ft 


+  583 


fi>6> 


+  561 
+  2.253 


S  (f.  b)  =  +  583  - 

M~A  =  +  249 

M  =  8  +  2.253  =■■  10.253 

L'avantage  que  présente  le  procédé  indirect  est  très 
appréciable  :  il  dispense  de  calculs  parfois  fort  longs 
lorsque  les  classes  sont  nombreuses  et  que  les  fréquences 
sont  exprimées  par  des  nombres  considérables  ;  au  lieu  de 
procéder  à  des  calculs  écrits,  on  peut  souvent  se  borner, 
dans  le  procédé  indirect,  à  un  calcul  mental  dont  on  écrit 
directement  le  résultat.  Par  contre,  le  procédé  indirect  ne 
conduit  qu'à  une  approximation  lorsque  les  écarts  ne  sont 
pas  assez  rapprochés  ou  lorsque  la  répartition  des  unités  à 
l'intérieur  de  la  classe  ne  s'effectue  pas  d'une  manière 
uniforme. 
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232.  On  procède  de  même  que  pour  la  moyenne  arithmé- 
tique simple  lorsque,  au  lieu  de  nombres  absolus,  on  doit 
effectuer  les  calculs  sur  des  nombres  proportionnels  expri- 
mant combien  de  parties  du  tout  représente  chaque  groupe 
de  fréquences.  On  commence  par  déterminer  l'importance 
de  la  classe,  si  elle  est  comprise  entre  deux  limites,  et  on 
multiplie  les  nombres  proportionnels  par  l'indice  de  la 
classe  ;  le  total  des  produits  partiels  divisé  par  100  donne 
le  chiffre  du  salaire  moyen. 


Exemple  11.    —  Salaires  moyens  des  ouvriers  mâles  adultes 
dans  les  mines  de  houille,  en  Belgique,  au  31  octobre  1896 


Taux 
des  salaires 

Proportion  % 
des  ouvriers 

Produit 

Francs. 

1.00 

0 

25 

0.250 

1.745 

1 

40 

2.443 

2.245 

4 

67 

10.484 

2.745 

12 

50 

34.312 

3.245 

26 

85 

87.128 

3.745 

21 

94 

82.165 

4.245 

18 

33 

77.810 

4.745 

8 

25 

39.146 

5.245 

3 

08 

16.155 

5.745 

1 

28 

7.354 

6.245 

0 

71 

4.434 

6.745 

0 

31 

2.091 

7.245 

0 

43 

3.115 

100.00 

366.887 

306  fr.  88         „    „_  ... 

1  =  — ïôô —  =         ( ; 


(1)  A  titre  de  vérification,  cfr.  Bosco  (A.), 
•qui,  opérant  par  le  procédé  ordinaire,  a  trouvé 


Lezioni  di  statistica,  p.  508, 
le  même  résultat. 
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233.  Si  l'on  veut  se  faire  une  idée  précise  de  la  moyenne 
arithmétique,  on  ne  doit  pas  perdre  de  vue  qu'elle  consiste 
essentiellement  en*  un  partage  égal  et  compensatoire.  La 
moyenne  arithmétique  est  le  résultat  d'une  opération,  par 
laquelle  on  divise  un  total  en  un  nombre  donné  de  parties 
égales;  il  en  résulte  que  la  moyenne  multipliée  par  le 
nombre  de  termes,  ou  de  parties,  reconstitue  le  total.  Cette 
propriété  appartient  à  la  moyenne  arithmétique;  elle  est 
éminemment  caractéristique.  Partant  de  ces  principes  élé- 
mentaires, nous  pouvons  en  déduire  de  brèves  considéra- 
tions sur  la  sphère  d'application  et  sur  les  conditions  intrin- 
sèques du  calcul  de  la  moyenne.  Sa  compétence  est  certaine 
et  absolue  chaque  fois  qu'il  s'agit  de  trouver  une  expression 
générale,  pour  caractériser  une  série  statique,  c'est-à-dire 
une  série  de  nombres  qui  ne  marquent,  les  uns  par  rapport 
aux  autres,  que  de  faibles  oscillations.  De  pareilles  séries  ne 
sont  pas  rares  en  démographie;  le  rapport  des  naissances 
masculines  aux  naissances  féminines  en  fournit  un  exemple 
remarquable.  L'usage  de  la  moyenne  arithmétique  est  indi- 
qué également  dans  de  nombreux  relevés  des  sciences  météo- 
rologique et  astronomique. 

Dans  une  série  parfaitement  régulière,  la  moyenne  atteint 
une  haute  valeur  représentative  ;  elle  est  à  la  fois  le  centre 
de  gravité  de  la  série,  le  point  d'intersection  de  la  surface 
de  la  courbe  en  deux  parties  égales,  la  valeur  la  plus 
probable  autour  de  laquelle  les  autres  viennent  se  grou- 
per d'une  manière  symétrique,  d'autant  plus  nombreuses 
qu'elles  sont  plus  proches  de  la  moyenne. 

234.  Mais  les  courbes  qui  suivent  la  loi  de  la  répartition 
des  erreurs  accidentelles  sont  rares;  un  grand  nombre  de 
phénomènes  sociaux  dessinent  une  courbe  asymétrique,  soit 
qu'ils  n'obéissent  pas  à  la  loi  des  erreurs,  soit  qu'il  s'agisse 
de  séries  à  caractère  dynamique  ou  indétermiué.  Dans  ces 
cas,  la  moyenne  a  le  caractère  d'une  expression  synthétique 
d'un  caractère  abstrait;  elle  ne  correspond  d'habitude  à 
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aucune  des  manifestations  réelles  du  phénomène  et  a  pour 
objet  de  donner  une  idée  abrégée  d'un  ensemble  complexe. 
Dans  ces  cas,  la  compétence  de  la  moyenne  arithmétique 
s 'atténue  ou  disparaît  et  il  appartient  au  chercheur,  se  gui- 
dant d'après  les  circonstances,  de  faire  choix  entre  les 
moyennes  arithmétique,  géométrique,  harmonique  ou  con- 
tre-harmonique, etc. 

235.  Puisque  la  moyenne,  en  général,  est  une  expression 
synthétique  des  éléments  complexes  de  la  série,  il  est  indis- 
pensable qu'elle  exprime  un  ensemble  de  causes  aussi  étroi- 
tement unies  que  possible  ;  sans  cela,  elle  perd  sa  significa- 
tion et  les  comparaisons  entre  différentes  moyennes  sont 
vides  de  sens.  De  là  résulte  une  règle  essentielle,  à  savoir 
que  les  unités  composant  la  série  doivent  présenter  le 
caractère  le  plus  homogène  possible.  Si  les  phénomènes 
sont  influencés  visiblement  par  des  causes  différentes,  la 
moyenne  qu'on  en  tirera  sera  dénuée  de  signification  scien- 
tifique véritable  ;  elle  n  'exprimera  qu  'un  complexus  inintel- 
ligible et  ne  se  prêtera  pas  à  des  comparaisons  logiquement 
déduites  (1). 

Le  caractère  homogène  d'une  série  doit  s'apprécier  sous 
les  trois  aspects  suivants  :  1°  la  nature  des  données; 
2°  l 'époque  à  laquelle  elles  se  rapportent  ;  3°  le  lieu  où  elles 
ont  été  réunies. 

Une  série  peut  être  homogène  dans  son  ensemble  et  pour- 
tant certains  des  termes  qui  la  composent  peuvent  obéir  à 
des  tendances  particulières,  en  sorte  qu'il  y  aurait  avan- 
tage à  ne  pas  les  comprendre  dans  la  moyenne  générale. 
Si  l'on  considère  d'une  part  tous  les  couples  mariés, 
d'autre  part  le  nombre  d'enfants  nés-  en  légitime  mariage, 
il  est  évident  que  l'on  se  trouve  dans  des  conditions  géné- 
rales favorables  pour  calculer  la  moyenne  des  enfants  par 
mariage.  Mais,  comme  le  fait  observer  Zizek  (2),  des  doutes 


(1)  Zizek,  Statistical  aucraye,  p.  65. 

(2)  Id.,  loc.   cit.,  pp.  67-68. 
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se  sont  élevés  sur  le  point  de  savoir  s'il  ne  vaudrait  p;>.^ 
mieux  éliminer  les  couples  sans  enfants  et  calculer  la 
moyenne  seulement  sur  le  nombre  de  personnes  mariées 
ayant  au  moins  un  enfant.  La  raison  alléguée  serait  que 
l'absence  d'enfants  trahirait  une  tare  physiologique  chez 
les  mariés  et  que,  pour  réunir  des  données  comparables,  il 
vaudrait  mieux  considérer  uniquement  des  couples  dont  le 
caractère  normal  serait  dénoté  par  l'existence  d'enfants. 
Nous  n'avons  pas  à  nous  prononcer  sur  le  bien-fondé  de 
cette  opinion  physiologique,  mais-  il  est  incontestable  que 
la  moyenne  serait  plus  exacte  si  elle  était  prise  uniquement 
sur  des  couples  ayant  eu  un  ou  plusieurs  enfants.  Il  peut 
être  extrêmement  important  de  connaître  séparément  le 
nombre  d'unions  stériles  et  surtout  de  s'assurer  si  leur 
nombre  relatif  a  une  tendance  à  augmenter  ou  s'il  reste 
stationnaire.  On  pourrait  arriver  à  une  précision  plus 
grande  encore  en  établissant  des  catégories  parmi  les 
couples  mariés,  d'après  l'âge  des  conjoints  au  moment  de 
leur  union,  et  en  calculant  pour  chacune  de  ces  catégories 
le  nombre  moyen  d'enfants  par  mariage.  Evidemment,  ces 
données  ne  peuvent  être  réalisées  sous  leur  forme  la  pins 
parfaite  que  si  le  statisticien  dispose  de  données  originales  ; 
celui  qui  travaille  sur  des  données  déjà  publiées  est  forcé 
de  les  utiliser  dans  l'état  où  il  les  trouve. 

236.  Lorsqu'on  étudie  la  condition  d'homogénéité,  on  est 
surpris  des  conditions  rigoureuses  que  le  respect  de  cette 
condition  impose.  La  question  des  salaires,  si  féconde  en 
applications  statistiques,  en  fournit  une  illustration  nou- 
velle. Les  statisticiens  qui  commencèrent  l'étude  des  sa- 
laires sous  le  rapport  statistique,  se  bornèrent  souvent  à  des 
indications  générales  portant  sar  de  vastes  catégories  de 
travailleurs  ;  on  parlait  habituellement  du  «  salaire  moyen 
de  l'ouvrier  mineur  »,  sans  distinguer  entre  le  fond  et  la 
surface,  du  «  salaire  moyen  de  l'ouvrier  de  fabrique  »,  ou 
de  celui  de  «  l'ouvrier  de  métier  ».  Ces  moyennes  générales 
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présentaient  le  grave  inconvénient  d'éclairer  très  peu  le 
public  quant  aux  condition»  réelles  de  la  classe  ouvrière, 
car  ces  indications  vagues  ne  correspondaient  à  aucune 
situation  existante.  Pour  obtenir  une  vue  d'ensemble  des 
salaires  répondant  à  la  condition  d'homogénéité,  il  convient 
de  partager  les  salaires  en  un  assez  grand  nombre  de 
classes.  Ainsi,  on  mettra  à  part  les  enfants  et  les  adultes  ; 
les  premiers  ne  gagnent  pas  un  salaire  comparable  à  celui 
des  seconds  ;  leurs  forces  sont  moindres,  leur  capacité  pro- 
fessionnelle est  à  ses  débuts,  souvent  leur  salaire  est  consi- 
déré comme  un  salaire  d'appoint,  etc.  D'autre  part,  nous 
savons  que  le  sexe  est  un  facteur  dont  l'importance  est  dé- 
montrée en  ce  qui  concerne  la  fixation  du  taux  des  salaires  ; 
il  convient  donc  d'envisager  séparément  le  salaire  des- 
hommes  et  celui  des  femmes  parmi  les  travailleurs  adultes. 
Ensuite,  il  serait  du  plus  haut  intérêt  d'observer  les  salaires 
par  groupes  d'âge  :  l'homme  dans  la  pleine  possession  de 
son  énergie  produit  plus  que  celui  dont  les  forces  déclinent  ; 
quel  est  l'âge  de  pleine  production?  quelle  est  la  courbe  du 
salaire  d'après  l'âge?  Les  statistiques  des  salaires  n'ont 
pas  encore  porté  la  lumière  sur  ce  point  (1)  ;  il  serait 

(  1  )  La  Statistique  belge  des  accidents  du  travail  a  rangé  les  victimes 
d'accidents  du  travail  d'après  leur  âge  et  d'après  le  salaire  moyen  sur  lequel 
la  réparation  a  été  calculée.  Voici  les  données  générales  pour  tous  les 
groupes  d'industrie  (sans  les  entreprises  agricoles  proprement  dites)  . 

Salaire  annuel  moyen 


De  moins  de  15  ans  ........     Fr.  408.67 

.15  à  20  ans  .     .     .    761.68 

20  à  30  ans   1,178.13 

30  à  40  ans  .     .                                      .  1,285.08 

40  à  45  ans   1,287.10 

45  à  50  ans  ...     .     .     .     .     .     .     ....  1,229.69 

50  à  55  ans                                         .     .  1,173.01 

55  à  60  ans  .                                  .     .     .  1,140.56 

60  «à  70  ans  .     .   1,052.19 

70  et  plus                                                 .  923.49 


Il  résulte  de  ces  chiffres  que  le  salaire  est  le  plus  élevé  à  partir  de  30  ans 
et  qu'il  reste  à  peu  près  stationnaire  jusqu'à  45  ans;  à  partir  de  cet  âge,  il 
diminue  pour  se  réduire,  à  l'âge  extrême  de  70  ans  et  plus,  au  niveau  des 
années  de  la  jeunesse.  (Office  du  travail  de  Belgique.  Statistique  des  acci- 
dents du  travail,  année  1906,  t.  I,  p.  635.) 
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cependant  fort  intéressant  de  trouver  la  réponse  à  ces 
questions  et  de  construire  des  moyennes  vraiment  homo- 
gènes, sur  ces  bases.  Mais  il  ne  suffit  pas-  encore  de  ces 
distinctions;  il  en  est  d'autres  tout  aussi  importantes  : 
l'industrie  et  la  profession.  C'est  seulement  en  opérant  des 
groupements  de  plus  en  plus  étroits  qu'on  parvient  à  cal- 
culer des  moyennes  homogènes. 

L'époque  à  laquelle  les  données  ont  été  recueillies  est  aussi 
un  facteur  à  considérer,  de  même  que  la  durée  de  l'obser- 
vation. Des  salaires  recueillis  en  janvier  ne  sont  pas  com- 
parables à  d'autres,  même  se  rapportant  à  des  catégories 
identiques  de  travailleurs,  observés  en  juillet.  L'influence 
des  saisons  est  extrêmement  sensible  parmi  de  vastes  caté- 
gories de  travailleurs  ;  la  morte-saison  et  la  saison  de 
pleine  activité  impriment  à  leurs  gains  des  oscillations  for- 
tement marquées.  C'est  pour  la  même  raison  qu'on  ne  peut 
se  contenter  d'une  période  d'observation  trop  courte; 
l'idéal  serait  évidemment  d'obtenir  la  succession  des  sa- 
laires pendant  une  année  entière. 

Enfin,  il  est  bien  évident  que  le  milieu  réagit  sur  les  con- 
ditions des  phénomènes.  Pour  obtenir  des  données  absolu- 
ment comparables  ou  homogènes,  il  faudrait  ne  grouper 
que  des  phénomènes  soumis  aux  mêmes  influences  de  milieu, 
ou,  dans  la  comparaison,  pouvoir  éliminer  l'influence  due 
aux  milieux  divers. 


III.  —  Moyenne  géométrique. 

237.  La  définition  de  la  moyenne  géométrique  est  la  sui- 
vante :  c'est  la  valeur  qui  correspond  à  la  racine  du  produit 
des  termes,  portée  à  un  exposant  égal  au  nombre  des-  termes. 

La  moyenne  géométrique  de  24  et  33  est  donc  : 


G  =  |/  24  x  33  =  28.1424946 
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Lorsqu'il  y  a  trois  termes,  au  lieu  de  la  racine  carrée, 
on  calcule  la  racine  cubique  du  produit  des  termes.  Ainsi, 
pour  24,  33  et  6,  on  a  : 

G  =  1^24  x  33  x  6  =  16.81341S2. 

La  valeur  de  l'exposant  augmentant  avec  le  nombre  de 
termes,  on  est  rapidement  conduit,  par  la  méthode  arithmé- 
tique, à  des  calculs  longs  et  compliqués.  Supposons  qu'il 
faille  tenir  compte  des  variations  des  prix  d'un  certain 
nombre  de  marchandises,  admettons  qu'elles  soient  au  nom- 
bre de  45  comme  dans  VIndex-Numbers  de  Sauerbeck,  on 
se  trouverait  devant  une  tâche  presque  insurmontable  : 
c'est  pour  cette  raison  que  l'on  substitue  au  calcul  arithmé- 
tique la  recherche  au  moyen  de  logarithmes  et  l'on  a  alors 
cette  définition  très  simple  : 

La  moyenne  géométrique  d'une  série  de  termes  est  le 
nombre  naturel  qui  correspond  au  logarithme  moyen  des 
logarithmes  de  chacun  des  termes,  ce  qu'exprime  la 
formule  : 

log.  1.2  (log.  X)  (14) 

238.  Il  n'est  pas  inutile  de  faire  une  application  étendue 
de  cette  formule;  on  n'en  trouve  que  très  peu  d'exemples 
pratiques  dans  les  traités  de  statistique  et  cette  pénurie 
embarrasse  souvent  l'étudiant  qui  se  demande  dans 
quelles  conditions  il  doit  appliquer  la  formule. 

Parmi  des  amandes  achetées  dans  un  magasin  de  la  ville, 
54  ont  été  prises  au  hasard  et  mesurées  avec  une  extrême 
précision,  au  dixième  de  millimètre.  Il  s'agit  de  déterminer, 
parmi  ces  54  mesures,  quelle  est  la  moyenne  géométrique. 
Le  calcul  arithmétique  exigerait  que  l'on  fît  le  produit  de 
54  termes  l'un  par  l'autre  et  que  l'on  prît  la  racine  54'  de 
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ce  produit,  ce  qui  est  impossible.  Le  calcul  par  les  loga- 
rithmes se  dispose  comme  suit  : 

EXEMPI/E  12. 


Longueur 

Logarithmes 

Longueur 

Logarithmes 

Longueur 

Logarithmes 

des 

des  nombres 

des 

des  nombres 

des 

des  nombres 

amandes 

ei-conlrc 

amandes 

ci-contre 

amandes 

ci-contre 

(1/10'de  m/m) 

258 

2.41161971 

310 

2.49136169 

334 

2.52374647 

262 

2.41830129 

310 

2  49136169 

335 

2  52504481 

265 

2.42324587 

312 

2.49415459 

339 

2.53019070 

267 

2.42651126 

313 

2  49554434 

344 

2.53655844 

269 

2.42975228 

314 

2.49692965 

348 

2.54157924 

276 

2 . 44090908 

318 

2.50242712 

349 

2.54282543 

291 

2.46389299 

321 

2.50550503 

352 

2.54654266 

294 

2.46834733 

324 

2.51054501 

356 

2.55145000 

295 

2.46982202 

325 

2.51188336 

359 

2.55509445 

295 

2.46982202 

325 

2.51188336 

359 

2.55509445 

299 

2.47567119 

325 

2.51188336 

362 

2.55870857 

299 

2.47567119 

326 

2.51321760 

362 

2.55870857 

299 

2.47567119 

329 

2.51719590 

363 

2.55990663 

302 

2.48000694 

329 

2.51719590 

364 

2.56110138 

304 

2.48287358 

329 

2.51719590 

365 

2.56229286 

307 

2.48713838 

330 

2.51851394 

366 

2.56348109 

308 

2.48855072 

331 

2.51982790 

369 

2.56702637 

310 

2.49136169 

333 

2.52244123 

372 

2.57054294 

S  log.  =  134.34713436. 
M  log.  =  2.48790989. 
G        =  307. 503. 
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239.  L'emploi  de  la  moyenne  géométrique  est  peu  ré- 
pandu. Il  faut  attribuer  ce  fait  à  la  complication  des  cal- 
culs; les  personnes  auxquelles  l'usage  des  tables  de  loga- 
rithmes n'est  pas  familier,  se  perdent  facilement  dans  le 
dédale  des  colounes  de  chiffres,  surtout  lorsqu'il  s'agit  de 
trouver  le  logarithme  de  nombres  de  6  ou  7  chiffres.  Cette 
difficulté  matérielle,  qui  ne  résulte  que  de  l'absence  d'exer- 
cice, ne  doit  pas  éloigner  de  la  moyenne  géométrique,  ni 
surtout  la  faire  condamner  quand  son  emploi  est  reconnu 
préférable  à  la  moyenne  arithmétique. 

La  moyenne  géométrique  est,  dans  des  cas  nombreux, 
recommandée  par  une  série  imposante  d'autorités  :  Stan- 
ley Jevons,  un  des  plus  brillants  esprits  de  son  temps  ; 
Galton  qui,  après  Quetelet,  a  rénové  la  statistique;  Edge- 
worth  dont  les  travaux  font  autorité  ;  Bowley  et  Yule  dont 
nous  avons  eu  maintes  fois  l'occasion  de  citer  et  de  suivre 
les  remarquables  travaux,  ont  fait  ressortir  avec  une 
grande  force  d'arguments,  les  avantages  particuliers  de 
cette  moyenne. 

Stanley  Jevons  l'a  surtout  recommandée  à  propos  des 
statistiques  des  prix  (1)  ;  selon  lui,  la  moyenne  arithmétique 
aurait  pour  effet,  en  général,  d'exagérer  les  prix  qui  ont 
augmenté,  aux  dépens  de  ceux  qui  ont  baissé.  Si  une  mar- 
chandise A,  dit  Jevons,  augmente  de  100  p.  c,  son  index- 
numbers  est  porté  à  200  ;  si,  en  même  temps,  une  marchan- 
dise B  diminue  de  50  p.  c,  son  index-numbers  est  ramené 
à  50  ;  la  moyenne  arithmétique  pour  A  -|~  B  est  donc  : 

200  +  80  =  )26; 
2 

la  moyenne  géométrique  serait  : 

200x50  =  100, 

c'est-à-dire  que  le  niveau  général  des  prix  resterait  in- 


(1)  Stanley  Jevons,  A  serions  fall  on  the  value  of  gold  ascertained, 
London,  1863. 
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changé,  tandis  que  la  moyenne  arithmétique  le  ferait  appa- 
raître 25  p.  c.  plus  élevé. 

Dans  un  travail  subséquent  (1),  publié  en  1865, 
Stanley  Jevons  n'apporte  pas  d'argument  nouveau 
en  faveur  de  la  moyenne  géométrique  et  se  borne  à 
reproduire  l'exemple  que  nous  venons  de  rappeler,  mais 
dans  son  remarquable  ouvrage  The  principles  of  science, 
publié  en  1892,  il  reprend  et  amplifie  ses  premières  con- 
clusions. D'après  l'éminent  économiste  anglais,  «  dans  tous 
les  calculs  qui  visent  à  exprimer  le  quantum  des  progrès 
de  la  société,  la  moyenne  géométrique  devrait  être  em- 
ployée (2)  »  et  il  donne  cet  exemple  :  <(  une  quantité  quelcon- 
que (houille,  fer,  commerce)  ayant,  en  100  ans,  augmenté 
de  100  p.  c,  on  se  tromperait  fort  en  disant  qu'en  moyenne, 
à  la  fin  de  chaque  décade,  la  quantité  primitive  a  augmenté 
de  10  p.  c.  ;  de  cette  façon,  on  arriverait  en  réalité,  à 
159  p.  c.  La  vraie  moyenne  serait  la  moyenne  géométrique 


V     2  soit  environ  1.07, 

ce  qui  donnerait  une  augmentation  de  7  p.  c.  environ  tous 
les-  dix  ans  ». 

Galton  a  également  défendu  l'emploi  de  la  moyenne 
géométrique  dans  les  statistiques  sociales  et  de  la  vie. 
D'après  Galton  (3)  on  ne  pourrait  admettre  comme 
exacte  en  ce  qui  concerne  les  sciences  de  la  vie  l'hypothèse 
selon  laquelle  les  erreurs  en  plus  et  les  erreurs  en  moins 
par  rapport  à  la  mesure  exacte  sont  également  probables 
et  que,  par  conséquent,  la  moyenne  arithmétique  de  ces  me- 
sures est  la  plus  proche  de  la  vérité.  La  valeur  la  plus  pro- 


(1)  Stanley  Jevons,  «  On  the  variation  of  priées  and  the  value  of  eurreney 
sinee  1782  ».  (Journal  of  the  Statistical  Society.  1865,  June,  p.  295,  note.) 

(2)  Stanley  Jevons,  The  Principles  of  Science,  London,  1892,  p.  362. 

(3)  Sir  Francis  Galton,  «  The  géométrie  mean,  in  vital  and  social  statis. 
tics  »  (Procecdings  of  the  Royal  Society,  n°  198,  1879.  —  Réimpression  dans 
Natural  Inheritance,  London,  1889,  annexe  E,  p.  238.) 


388 


PRINCIPES    DE  STATISTIQUE 


bable,  dans  ces  cas,  serait  donnée  par  la  moyenne  géomé- 
trique. Galton  pense  également  que  la  moyenne  géomé- 
trique est  à  préférer  à  la  moyenne  arithmétique  lorsqu'il 
s'agit  de  phénomènes  de  la  vie  qui  ont  des  relations  avec 
la  sociologie,  par  exemple  l'augmentation  de  la  population. 
Les  phénomènes  sociologiques,  comme  les  phénomènes  de  la 
vie,  dit  Galton,  doivent,  en  général,  être  traités  à  l'aide  de 
la  moyenne  géométrique  (1). 

MM.  Edgeworth  et  Bowley  ont  appuyé  ces  considérations 
et  ont  fait  remarquer,  en  outre,  que  la  moyenne  géométrique 
possédait  de  plus  l'avantage  de  rendre  à  peu  près-  indiffé- 
rent le  choix  de  l'année  de  base  dans  les  statistiques  des 
prix. 

Toutes  ces  considérations  n'ont  pu  rendre  fort  popu- 
laire la  moyenne  géométrique.  Non  seulement,  son  emploi 
assez  difficile  rebute  les  chercheurs,  mais  son  caractère 
mathématique  abstrait  ne  contribue  pas  peu,  comme 
M.  Yule  (2)  le  remarque  avec  raison,  à  lui  conserver  le  ca- 
ractère d'une  méthode  d'exception. 

240.  Lorsque  les  différences  entre  les  nombres  de  la  sé- 
rie ne  sont  pas  accusées,  le  résultat  du  calcul  ne  change 
guère,  que  l'on  emploie  la  moyenne  arithmétique  ou  la 
moyenne  géométrique. 


(  1  )  Une  curieuse  application  de  la  moyenne  géométrique  a  été  proposée 
par  I.  H.  van  Thunen,  dans  son  ouvrage  fameux  :  Der  Isolirtc  Staat.  D'à-près 
Luigi  Cossa  {Histoire  des  doctrines  économiques,  trad.  française,  Paris,  1899, 
p.  410),  van  Thunen  «  crut  avoir  déterminé  le  juste  salaire  dans  la  formule 
Va  p  c'est-à-dire  la  racine  carrée  du  produit  que  l'on  obtient  en  multipliant 
la  somme  exprimant  la  valeur  des  choses  nécessaires  à  l'entretien  de  l'ouvrier 
par  celle  qui  indique  la  valeur  des  produits  obtenus  par  son  travail  ».  Ainsi, 
si  l'entretien  de  l'ouvrier  est  représenté  par  la  somme  de  fr.  3.00  et  la  valeur 

2  

ajoutée  au  produit  par  fr.  8.00,  on  a  :  \,'  3  .  8  =  4  tr.  8989,  ce  qui  représen- 
terait le  juste  salaire.  «  Mais,  ajoute  Luigi  Cossa,  ces  prémisses  étaient 
arbitraires  et  insuffisantes.  » 

(2)  Yule  (G.  U.),  An  Introduction  to  the  theory  of  statistics.  London,  1911, 
t>.  124. 
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Les  nombres  20,  21,  22  ont  pour  moyenne  arithmétique  : 

20  +  21+  22_2L 
3 

Leur  moyenne  géométrique  est  : 

1^20  .  21  .  22  =  20  9841150 

expression  qu'on  doit  traduire  en  pratique  par  21,  valeur 
de  la  moyenne  arithmétique. 

241.  Cette  remarque  limite  l'emploi  de  la  moyenne  géo- 
métrique aux  cas  dans  lesquels  les  termes  de  la  série  dif- 
fèrent d'une  manière  assez  sensible. 

Se  trouvent  spécialement  dans  ce  cas,  les  séries  qui  réu- 
nissent des  données  relatives  à  l'accroissement  de  la  for- 
tune publique  ou  de  l'activité  économique,  dans  lesquelles 
interviennent  plusieurs  éléments  doués  d'une  vitesse  va- 
riable. Dans  un  travail  antérieur,  nous  avons  essayé  de 
caractériser  les  progrès  économiques  de  la  Belgique  au 
cours  de  la  période  1880-1908  (1).  Les  moyennes,  dans  cette 
étude,  sont  des  moyennes  arithmétiques  ;  reprenant  une 
partie  de  nos  résultats  —  ceux  relatifs  aux  échanges,  —  de 
1895  à  1908,  nous  avons  calculé,  à  côté  de  la  moyenne  arith- 
métique, la  moyenne  géométrique.  Le  tableau  ci-après  fait 
apparaître  les  différences  entre  les  deux  résultats. 


(1)  Julin  (Arm.),  «  The  économie  prooress  of  Belgium  fiom  1880  to 
1008  ».  (Journal  of  the  Royal  Statistical  Society,  February,  1911,  pp.  251-313.) 
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1908 

183  0 
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1 

195.3 
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1 
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O 
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157  0 
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D'après  l'exemple  qui  précède,  les  résultats  calculés- 
d'après  la  moyenne  géométrique  et  d'après  la  moyenne 
arithmétique  sont  assez  distants  les  uns  des  autres.  La  rai- 
son en  est  que  certains  éléments-  de  la  moyenne  ont  pris  un 
développement  considérable  durant  la  période  envisagée; 
il  en  va  ainsi  du  commerce  extérieur  (importations  et  ex- 
portations), de  la  navigation  maritime,  des  transports  de 
houille  et  de  coke  par  voies  navigables,  du  nombre  de  voya- 
geurs transportés  par  chemin  de  fer,  du  montant  des  effets 
encaissés  et  escomptés,  etc.  La  moyenne  arithmétique  est 
très  sensible  à  ces  accroissements,  tandis  que  la  moyenne 
géométrique  —  c'est  l'une  de  ses  propriétés  essentielles  — 
ne  les  enregistre  qu'en  en  modérant  l'intensité.  Ceci  nous- 
fournit  une  indication  nouvelle  pour  l'emploi  de  la 
moyenne  géométrique  ;  elle  est  le  plus  souvent  inférieure  à 
la  moyenne  arithmétique  et  n'est  jamais  plus  grande  que 
celle-ci  (1). 

242.  Lorsque  la  série  ne  possède  pas  un  caractère  dyna- 
mique, ou  que  tous  ses  éléments  progressent  d'une  manière 
sensiblement  égale,  —  comme  c'est  le  cas  le  plus  habituel 
dans  les  séries  de  prix  relevés  dans  les  Index-numbers,  — 
les  résultats  obtenus  à  l'aide  de  la  moyenne  arithmétique 
ou  de  la  moyenne  géométrique  restent  sensiblement  égaux. 
Comme  l'a  fait  remarquer  M.  Edgeworth  (2),  ceci  est  un 
corollaire  de  la  proposition  plus  générale  d'après  laquelle 
aucune  espèce  de  moyenne  résultant  d'un  groupe  d'obser- 
vations ne  peut  différer  beaucoup  d'aucune  autre  espèce  de 
moyenne.  Comme  mesure  pratique,  on  peut  adopter  la  re- 
commandation faite  par  Bowley  de  contrôler  la  moyenne 
géométrique  par  l'usage  de  la  moyenne  arithmétique  : 


(1)  Cfr.  une  démonstration  par  le  calcul  différentiel  de  cette  propriété  par 
M.  le  professeur  Wabren  Milton  Peesons.  (Zïzek,  Statistical  averages, 
pp.  195-196,  note.) 

(2)  Edgewokth,  «  A  defence  of  Index-Numbers  ».  {The  Economie  Journal. 
1896,  p.  13G.) 
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quand  les  deux  résultats  diffèrent  d'une  manière  sensible, 
il  y  a  lieu  d'adopter  la  moyenne  géométrique  qui  est  plus 
correcte  à  raison  de  la  faculté  qu'elle  possède  de  diminuer 
l'effet  des  nombres  les  plus  importants  de  la  série. 

IV.  —  Moyenne  harmonique. 

243.  La  moyenne  harmonique  est,  des  trois  moyennes 
classiques,  celle  dont  l'emploi  est  le  moins  fréquent.  On  la 
définit  en  disant  qu'elle  est  la  réciproque  de  la  moyenne 
arithmétique  des  réciproques  des  termes.  Elle  a  pour 
expression  générale  la  formule  : 

H   n  

"1      J_      1  j_  (15) 

«1        a-2  «3 

et,  en  ne  considérant  que  deux  termes  !  &],  a2  i 

2 

i  +  t 

ax       a  2 

et,  en  réduisant  les  termes  à  leur  dénominateur  commun  : 

2 

«i  -I-  a-2 
aj  .  at 

d'où  l'on  a,  en  multipliant  le  numérateur  et  le  dénomina- 
teur de  la  fraction  par  a1?  a2  : 

^-  *À  (16) 

«i  +  ûf? 

mais  cette  formule  ne  trouve  son  application  que  dans  le 
cas  particulier  où  la  moyenne  doit  être  prise  entre  deux 
termes  (1). 


(1)  Messedaglia,  «  Calcul  des  valeurs  moyennes  ».  (Annales  de  démographie 
internationale,  1880,  p.  397.) 
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La  valeur  numérique  dé  la  moyenne  harmonique  est  la 
plus  basse;  la  plus  élevée  est  celle  de  la  moyenne  arithmé- 
tique ;  la  moyenne  géométrique  tient  le  milieu  : 

Rappelons  l'application  que  nous  avons  faite  (Cfr.  supra 
h"  222)  sur  les  nombres  :  34,  38,  42,  46. 

Moyenne  arithmétique  =  40. 
Moyenne  géométrique  =  39,750 
Moyenne  harmonique  =  39,498. 

L'importance  de  l'écart  entre  les  diverses  moyennes  dé- 
pend pour  une  large  part,  comme  le  fait  remarquer 
M.  Yule  (1),  de  la  grandeur  de  la  dispersion  par  rapport  à 
la  grandeur  de  la  moyenne. 

244.  Messedaglia  qui,  dans  son  mémoire  «  Calcul  des  va- 
leurs moyennes  »,  s'est  occupé  surtout  de  la  moyenne  har- 
monique, a  fait  remarquer  le  rapport  qui  existe  entre  la 
proportion  et  la  moyenne  arithmétique,  d'une  part,  et  la 
proportion  et  la  moyenne  harmonique  d'autre  part  (2).  La 
réciproque  de  chaque  terme  d'une  proportion  arithmétique 
ou  par  différence  constitue  une  proportion  harmonique  des 
réciproques;  d'où  la  réciproque  de  la  moyenne  arith- 
métique est  la  moyenne  harmonique  des  réciproques, 
ou  bien,  la  moyenne  harmonique  est  la  réciproque 
de  la  moyenne  arithmétique  des  réciproques. 

Le  même  auteur  a  fait  remarquer  que  la  moyenne  har- 
monique est  de  nature  à  rendre  des  services  dans  l'appré- 
ciation de  la  valeur  de  la  monnaie,  c'est-à-dire  de  la  quan- 
tité de  marchandises  qu'il  est  possible  de  se  procurer  avec 
une  certaine  somme  d'argent  (3).  En  général,  on  procède 
en  prenant  la  moyenne  arithmétique  des  prix;  en  cas  de 
hausse  de  prix,  la  quantité  de  marchandises  qu'on  pourrait 
se  procurer  avec  une  même  somme  diminue  d'autant.  Mais, 


(Il  Cfr.  aussi  Yule,  An  introduction  to  the  theory  of  statistics,  p.  129. 

(2)  Messedaglia,  «  Calcul  des  valeurs  moyennes  ».  (Annales  de  démographie 
internationale,  1880,  p.  391.) 

(3)  Id  ,  loo.  cit.,  pp.  414-418. 
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fait  observer  Messedaglia,  à  la  moyenne  arithmétique  des 
prix  ne  correspond  pas  précisément,  en  sens  inverse,  la 
moyenne  arithmétique  des  quantités.  La  moyenne  arithmé- 
tique des  prix  conduit  pour  des  quantités  à  une  valeur  infé- 
rieure à  la  valeur  réelle;  à  la  moyenne  arithmétique  des 
prix  correspond  la  moyenne  harmonique  des  quantités;  si 
l'on  veut  se  contenter  d'une  approximation  déjà  très 
proche,  on  peut  prendre  la  moyenne  géométrique. 

V.  —  Principales  propriétés  mathématiques  des  moyennes. 

245.  Les  moyennes  possèdent  des  propriétés  mathéma- 
tiques importantes;  elles  sont  à  la  base  de  plusieurs  dé- 
monstrations qu'on  trouvera  plus  loin.  Nous  passerons  en 
revue  les  principales  d'entre  elles. 

Moyenne  arithmétique  (M).  — ■  Avant  de  passer  à  l'exa- 
men des  propriétés  mathématiques  de  cette  moyenne,  il  y 
a  lieu  de  rappeler  sommairement  quelques  caractéristiques 
résultant  de  sa  nature  :  a)  la  moyenne  arithmétique  est  le 
centre  de  gravité  de  la  série,  ce  qui  résulte  de  l'idée  de  par- 
tage égal  qui  se  trouve  à  la  base  de  sa  définition  ;  h)  si  les 
termes  de  la  série  sont  égaux,  la  moyenne  est  égale  à  cha- 
cun d'eux;  c)  la  moyenne,  non  plus  que  le  résultat  de  l'ad- 
dition, ne  change  pas,  quel  que  soit  l'ordre  dans  lequel  les 
termes  qui  la  composent  se  trouvent  disposés. 

246.  La  somme  des  écarts  positifs  des  termes  par  rap- 
port à  la  moyenne  est  égale  à  la  somme  des  écarts  négatifs, 
c'est-à-dire  que  la  somme  algébrique  des  écarts  est  zéro. 

On  appelle  écart  la  différence  numérique  entre  un  terme 
de  la  série  et  la  moyenne.  Les  écarts  qui  accusent  une  dif- 
férence en  plus  sont  les  écarts  positifs  ;  ceux  qui  montrent 
une  différence  en  moins,  les  écarts  négatifs. 

M.  U.  Yule  (1)  donne  de  cette  propriété  une  démonstra- 
tion très  facile  et  très  claire  qui  a  l'avantage  de  justifier 


(1)  Yule,  loc.  cit.,  pp.  110  et  114. 
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le  procédé  abrégé  ou  indirect  du  calcul  de  la  moyenne  que 
nous  avons  exposé  plus  haut.  (Cfr.  n°  220.) 

Soient  :  X  la  valeur  de  chaque  terme  ;  A,  une  valeur  ar 
bitraire  choisie  pour  représenter  la  moyenne;  E,  l'écart 
entre  X  et  A  ;  /,  les  fréquences. 

Nous  avons  : 

X  =  A  +  l  (22) 

d'où 

S  (f.  X)  =  £  OT.  A)  +  S  (f.  g) 
or,  A  étant  une  valeur  constante  : 

M  =  A  +  "|  S  (f.  I)  (23) 

Si  M  et  A  sont  identiques,  on  a  : 

S  (f.  5)  =  0.  (24) 

On  peut  aussi  donner  la  démonstration  sous  cette 
forme  (1)  : 

Soit  la  formule  générale  de  M  : 

M  =  at  +  %  +  a3  +  .  .  •  +  a»  ,gv 
n 

Appelons  xt,  x2,  x3  les  écarts  de  chaque  terme  a1?  a2,  a3 
par  rapport  à  M  ;  il  vient  que  : 


Xi  = 

«1 

—  M 

x%  = 

a2 

—  M 

x3  = 

a3 

—  M 

Xn  ~~ 

—  M 

(1)  Bfnini  ;  Principii  di  statistica,  p.  94,  note.  Voyez  aussi  Virgilh. 
Statistica,  p.  82.  Hœpli,  Milan,  1911. 
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En  faisant  la  somme  des  écarts,  nous  avons  : 

^1  +  x2  +  x3  +  +■  xù  =  at  +  a2  -f  a3  +  .  .  .  .  +  an  —  n.  M 

ou,  en  substituant  à  M  sa  valeur  : 

«i  +  #2  +  #3  +  •  •  •  +  xn  =  a.i  -f-  a2  +  a3  -f  .  .  .  +  a»  — 

«1  +  ^2  +  «3  +  +  0>n 


—  n 

n 


=  «1  +  «2  +  «3  +  +  tf„  —  («!  +  «2  +  «3  +  •  •  •  •  +  «n.) 

D 'où  il  suit  évidemment  que  : 

+  ^2  +  *3  +  +  Xn  =  0 

Appliquons  cette  règle  à  notre  exemple  3  (Cfr.  n°  225) 
(nombre  des  mariages  en  Angleterre  et  dans  le  pays  de 
Galles,  de  1891  à  1900). 

Exemple  14.  M  ==  239,410.3 


—  70,049.5 


Années 

Mariages 

M. 

Ecarts 

1891 

226,526  - 

239,410.5 

=  *i 

12,884.5 

1892 

227,135 

239.41U.5 

—  X<£ 

12,275.5 

1893 

218,689  — 

239,410.5 

==  *3 

20,721.5 

1894 

226,449  — 

239,410.5 

=  X4 

12,961.5 

1895 

228,204  — 

239,410.5 

—  #5 

11,206.5 

1896 

242,764  — 

239,410  5 

=  Xq 

+ 

3,353.5 

1897 

249,145  — 

239,410.5 

=  *7 

+ 

9,734.5 

1898 

255,379  — 

239,410.5 

=  x8 

-f  15,968.5 

1899 

262,334  — 

239,410  5 

=  #9 

22,923.5 

1900 

257,480  — 

239,410.5 

=  X10 

18,069  5 

70,049.5 


247.  La  deuxième  propriété  de  la  moyenne  arithmétique 
peut  s'exprimer  ainsi  :  la  somme  des  carrés  des  écarts  à 
la  moyenne  est  un  minimum  par  rapport  aux  carrés  des 
écarts  qui  seraient  calculés  sur  un  terme  de  la  série  dif- 
férent de  la  moyenne,  ou  sur  un  autre  nombre  quelconque. 

Cette  proposition  peut  être  démontrée  à  l'aide  de  l'algè- 
bre élémentaire  (1).  A  la  notation  employée  ci-dessus,  ajou- 
tons seulement  les  symboles  y1}  y2,  y3  pour  désigner  les 


(1)  Benini  :  Principii  di  statistica,  p.  95,  note. 
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nouveaux  écarts,  et  z  la  différence  entre  la  moyenne  arith- 
métique et  la  valeur  adoptée  pour  en  tenir  lieu. 

Supposons  qu'au  lieu  de  la  moyenne  arithmétique 
239,410.5  (ex.  7),  'nous  utilisons  le  chiffre  240,000  (A), 


dans  ce  cas,  nous  aurions  : 

Exemple  15. 

y{  (1891)  =  226,526  —  240,000  =  —  13,474 

x,,  =   ==■  —  12,884.5 

z   =   =  —589.5 

M  —  A  =  239,410.5  —  240,000  =  —  589.5 

y2  (1892)  =  227,135  —  240,000  =  -  12,865 

x2  =-  =  —  12,275.5 

z  =                                   .  =  —  589  5 

M  —  A  =  239,410.5  —  240,000  =  —  589.5 


etc.,  d'où  il  suit  à  l'évidence  que  s  est  une  valeur  constante 
par  rapport  à  la  différence  entre  la  moyenne  exacte  et  le 
terme  qui  en  tient  lieu  et  dont  le  signe  est  positif  ou  négatif 
selon  les  cas.  On  aura  donc  : 

Ui  =  Xi  +  z 

Ul   =  *2  +  Z 

yz  =  a-3-|-2 


Un        Xn  +  * 

Elevons  au  carré  les  égalités-  précédentes  et  faisons-en  la 
somme  : 

y  =--•  x*  +  22  -f  2  x{  z 
Ul  =  xi  +  z2  +  2  x2  z 
vi  =  xi  +  z-z  +  2  X3  * 

 y*  -  ^  +  *2  +  2  9»  x 

S  (y*)  =  S  (x*)  +  nz*  +  2  z  2  (*) 
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Nous  avons  vu  précédemment  que  2  (x)  =  0.  Donc,  le 
produit  2  z  2  (x)  est  aussi  égal  à  zéro.  L'égalité  précédente 
se  réduit  donc  à  cette  forme  : 

2  {y2)  =  2  (x2)  +  n  z2 

En  élevant  x  au  carré  (x2),  nous  avons  rendu  positifs  les 
écarts  qui,  précédemment,  étaient  négatifs.  L'expression 
2  (y2)  =  2  (om)  +  n  s2  signifie  donc  que  la  somme  des 
carrés  des  écarts  de  chaque  terme  calculés  sur  un  nombre 
différent  de  la  moyenne  arithmétique  est  toujours  plus 
grande  que  celle  qui  résulte  de  la  comparaison  avec  la 
moyenne  arithmétique  :  celle-ci  réalise  donc  seule  la  con- 
dition du  minimum  (1). 

248.  On  a  aussi  donné  une  autre  démonstration  simple  de 
cette  propriété.  Nous  la  reproduisons  à  cause  surtout  de  sa 
brièveté  et  de  sa  clarté.  Appelons  y  les  déviations  mesurées 
d'après  une  autre  valeur  quelconque  que  la  moyenne;  don- 
nons la  dénomination  de  d  à  la  différence  entre  cette  va- 
leur et  la  moyenne,  désignée  par  x.  Alors,  pour  chaque 
terme  de  la  série  (x)  (2),  nous  avons: 

y  =  x  —  d  ;  y2  =  x2  -f-  2  xd  -f-  d2. 

En  portant  les  écarts  au  carré  : 

S  (y2)  =  2  (x2)  —  2  2  xd  -f  2  d*  =  2  (x2)  +  nd\ 

Or  2  xd  =  0  puisque  l'on  a  démontré  que  les  écarts  po- 
sitifs et  négatifs  s'annihilent;  donc  2  y2  est  le  plus  petit 
quand  nd2  =  0,  c'est-à-dire  quand  d  =  0. 

249.  L'exemple  14,  d'après  ce  qui  précède,  donnerait  les 
résultats  suivants  : 


(1)  La  même  démonstration  se  fait  en  utilisant  le  calcul  différentiel.  On 
en  trouvera  un  exemple  dans  Gabaglio,  Teoria  délia  statistica,  t.  IL 
pp.  119-120. 

(2)  Hooker,  «  An  Elementary  explanation  of  corrélation  ».  (Quarterly 
Journal  of  the  Meteorological  Society  of  London,  1908,  p.  281.) 
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Exemple  16, 


Mariages 


Ecarts 


1891 
1892 
1893 
1894 
1895 
1896 
1897 
1898 
1899 
1900 


M  = 


226,526  asi  -  12,884.3 
227,135  Xi  —  12,275.5 
218,689  xz  —  20,721.5 
226,4 19  £»4  —  12,961.5 
228,204  xb  —  1  1,206.5 
242,764  x6  -f-  3,353.5 
249,145  x-t  +  9,734.5 
255,379  x8  -(-  15,968.5 
262,334  x9  +  22,923.5 
257,480  û0i0  +  18,069.5 
239,410.5     +  70,049  5 


ï  (x2)  =  2,252,658,054.50 


166,010,340.23 
130,687,900.23 
429,380,562.25 
168,000,482.25 
125,585,642.25 
11,243,962.25 
94,760,490.25 
234,992,992.23 
523,486,832.23 
326,506,830.25 


—  70,049.5 


La  moyenne  des  carrés  =  225,2(55,805.45. 
Edgeworth  a  proposé  de  donner  à  cette  moyenne  de  car- 
rés le  nom  de  «  fluctuation  ».  Le  symbole  qui  la  désigne 


250.  Une  troisième  propriété  de  la  moyenne  arithmé- 
tique peut  être  formulée  en  ces  termes  :  Si,  pour  un  groupe 
de  phénomènes,  on  possède  plusieurs  séries  séparées  d'ob- 
servations, on  peut,  si  le  nombre  des  observations  est  iden- 
tique, trouver  la  moyenne  de  V ensemble  du  groupe  à  l'aide 
des  moyennes  des  séries  particulières  ;  on  peut  également 
calculer  la  moyenne  générale  à  l'aide  des  moyennes  par- 
tielles quand  les  observations  ne  sont  pas  identiques,  à  la 
condition  d'affecter  chaque  moyenne  d'un  poids  égal  au 
nombre  des  gra,ndeurs  qui  entrent  dans  sa  composition  (2). 

En  effet,  on  démontre  que  si  Nx  est  le  nombre  d'observa- 
tions de  la  première  série,  N2  celui  de  la  seconde  série,  M] 


(1)  Maech  (L.),  «  Essai  sur  un  mode  d'exposer  les  principaux  éléments  de 
la  théorie  statistique  ».  {Journal  de  la  Société  de  Statistique  de  l'avis,  1910, 
p.  450.) 

(2)  Yule  (U.  G  ),  An  introduction  to  the  theory  of  statislics,  p.  115. 


est(l)  : 


S  (xi  —  w)2 


(25) 


m 
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la  moyenne  dans  le  premier  cas,  M2  la  moyenne  dans  le  se- 
cond, on  a  (1)  : 

N.M  =  Ni  .  Mi  +  N2  .  M2  (26) 
Soit  l'application  suivante  : 

lre  série  2e  série 

236  244 

19SM  =  862  199  M  =  8^8  =  222 

223  4       -iU'°    233  4 

208  212 

862  888 

Moyennes  des  deux  séries 

M  -  862  +  888  -218,75 
o 

215  5 -f-222 

ou  M=     'V      =818,78  . 

2 

251.  La  moyenne  de  carrés  désignée  plus  haut  (Cfr. 
n°  249)  parle  symbole  fr  présente  elle-même  d'intéressantes 
particularités,  nous  retracerons  deux  d'entre  elles  d'une 
façon  sommaire  (2). 

A.  «  La  moyenne  des  carrés  de  grandeurs  associées  est 
égale  à  la  fluctuation  de  ces  grandeurs  augmentée  du  carré 
de  leur  moyenne.  »  (Mardi.) 

Soient  les  nombres  32,  36,  40,  44  (ax,  a?  az,  a4). 


M  =  38 
v  (a,  +  a2  +  rt3  +  Ci)2 


=  1464 


n 

=1444 
y?  =  20 

Donc  .  s  (aj  +  a2  +  o3  +  «4)2  =  M2  ,    ,  =  {i 
n  r 

B.  a  La  fluctuation  est  égale  au  carré  moyen  des  écarts, 

par  rapport  à-  une  base  quelconque,  diminuée  du  carré  de 

l'intervalle  entre  cette  base  et  la  moyenne.  »  (March.) 


(1)  Yule,  op.  cit.,  p.  115. 

(2)  Elles  ont  été  démontrées  avec  une  grande  précision  par  L.  March,  dans 
son  «  Essai  sur  un  mode  d'exposer,  etc.  ».  (Journ.  Soc.  Stat.,  Paris,  1910, 
p.  451  et  suivantes.) 
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Soient  les  nombres  comme  ci-dessus  et  la  valeur  arbi- 
traire 45  (A).  Nous  savons  que  M  =  38  et  =  20.  Appe- 
lons les  écarts  des  nombres  par  rapport  à  45. 

— K— '-  (M  —  A)2  =  m' 

n 

5^  =  69 
n 

(M  —  A)2  =  49 

w  (M  —A)2  =  69  —  49  =  20,  valeur  de  la  fluctuation. 

n 

252.  Moyenne  géométrique.  —  Cette  moyenne  présente 
deux  propriétés  particulièrement  intéressantes. 

En  premier  lieu,  on  remarque  que  le  carré  de  la  moyenne 
géométrique  coïncide  avec  la  moyenne  géométrique  des  car- 
rés des  termes.  Cette  loi  est  susceptible  d'une  généralisa- 
tion importante,  car  la  relation  exprimée  plus  haut  est 
exacte  aussi  à  l'égard  des  expressions  d'une  puissance  plus 
élevée. 

.  Cette  propriété  se  démontre  par  la  simple  lecture  des 
termes.  En  effet  : 

soient  ax,  a2  les  termes  de  la  moyenne,  on  a  : 

[[/ai  ■  a2)  =         ■  «22 
et,  à  un  degré  plus  élevé  : 

(|/ai  •  ctj  ==  [/'a*  -  a* 
ou  enfin  quel  que  soit  le  nombre  des  termes  : 

Faisons  application  de  cette  propriété  aux  nombres  24 
et  33  (Cfr.  n°  237). 

G  =  1^24  .  33  =  28.1424946 


26 
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Le  carré  de  ce  nombre  (28.1424946)  =  791.996. 

Les  carrés  des  termes  sont  :  576  et  1089. 

La  moyenne  géométrique  de  ces  nombres  est  :  792  alors 
que  le  carré  de  la  moyenne  géométrique  est,  comme  nous 
venons  de  le  voir,  791.996,  c'est-à-dire  792  à  quatre  mil- 
lièmes près. 

253.  La  seconde  propriété  de  la  moyenne  géométrique  est 
la  suivante  :  La  réciproque  de  la  moyenne  géométrique 
coïncide  avec  la  moyenne  géométrique  des  réciproques. 

La  réciproque  de  la  moyenne  géométrique 

s'écrit  : 

1 

et  la  réciproque  des  termes  : 

1  1 

—  et  — 

d\  «2 

D'où  l'on  a  la  moyenne  géométrique  des  réciproques  : 


i/' 


L  1 

De  là,  se  tire  l'égalité  : 


'a 


S/a 

254.  Enfin,  le  logarithme  de  la  moyenne  géométrique  est 
égal  à  la  moyenne  arithmétique  des  logarithmes  des  termes, 
car  nous  avons  évidemment  : 

_  log.  qt  +  log.  «2  +  log-  fl3  •  •  •  •  4-  I°g-  an  Qu 
n 

log.  G=iS(log.  an)  (14) 

Les  propriétés  susdites  de  la  moyenne  géométrique  ne 
sont  pas  applicables  à  la  moyenne  arithmétique,  sauf  le  cas 
où  il  y  a  égalité  entre  les  termes. 
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255.  Nous  avons  déjà  fait  observer  (Cfr.  n°  243)  que 
des  trois  moyennes  classiques  (arithmétique,  géométrique, 
harmonique)  la  plus  forte  est  la  moyenne  arithmétique,  la 
plus  faible  la  moyenne  harmonique  et  que  la  moyenne  géo- 
métrique se  place  entre  les  deux.  Les  statisticiens  italiens, 
particulièrement  Messedaglia  (1)  et  Gabaglio  (2)  se  sont 
attachés  à  faire  ressortir  les  relations  qui  existent  entre 
les  différentes  moyennes;  nous  empruntons  à  ce  dernier 
auteur  les  considérations  ci-après  (3),  en  les  faisant  suivre 
d'un  exemple. 

Soient  les  trois  nombres  4,  5,  6. 

1°  La  moyenne  arithmétique  est  la  moyenne  arithmétique 
entre  la  moyenne  harmonique  (valeur  la  plus  basse)  et  la 
moyenne  contre-harmonique  (valeur  la  plus  élevée). 

Calculée  sur  les  nombres  ci-dessus  : 

M  =  5 
H  =  4.865 
C.  H  =  5.133 

H  -4-  C  H 

 =  4.999  ou  5,  valeur  de  M. 

2°  On  tire  de  là  que  le  total  de  la  moyenne  harmonique  et 
de  la  moyenne  contre-harmonique  est  égal  à  deux  fois  la 
moyenne  arithmétique. 

H  (4.865)  +  C.  H.  (5.133)  =  9.998  =^2M  (5) 

Donc,  étant  donné  deux  quelconques  des  trois  moyennes, 
on  peut  en  déduire  la  troisième  (4). 


(1)  Messedaglia,  «  Calcul  des  valeurs  moyennes  ».  (Annales  de  démographie 
internationale,  t.  IV,  1880,  p.  387  et  suivantes.) 

(2)  Gabagt.io  (A.),  Tcoria  générale  délia  statistica.  Milano,  1888,  t.  II, 
pp.  200-211. 

(3)  Pour  la  démonstration  mathématique,  voir  Gabaglio,  loc.  cit., 
pp.  200-211. 

(4)  Messedaglia,  «  Calcul  des  valeurs  moyennes  »,  loc.  cit.,  p.  394. 
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3°  La  moyenne  géométrique  est  la  moyenne  géométrique 
entre  la  moyenne  harmonique  et  la  moyenne  arithmétique; 
chacune  de  ces  deux  dernières -est  une  troisième  propor- 
tionnelle de  même  nature,  entre  l'autre  et  la  géométrique. 

G  =  1/4.5.6  =  4.932 
M  =  5 

H  =  4.864887 

Donc  : 


G  =  |/o  .  4,864887  =  t/24.324  =  4-932 

4°  Par  conséquent,  en .  multipliant  la  moyenne  arithmé- 
tique par  la  moyenne  harmonique,  on  obtient  le  carré  de  la 
moyenne  géométrique. 

M  =  5 

H  =  4.864887 
M  x  H  =  G*  =  4.9322  =  24.324 

5°  La  moyenne  arithmétique  des  réciproques  est  la  réci- 
proque de  la  moyenne  harmonique  (1). 

i  _  mm  o,2o85 

H  3 

6°  La  réciproque  de  la  moyenne  harmonique  est  la 
moyenne  arithmétique  des  réciproques. 
Cette  proposition  découle  de  la  précédente. 

7°  La  moyenne  harmonique  est  la  réciproque  de  la 
moyenne  arithmétique  des  réciproques. 
La  valeur  des  réciproques  de  4,  5,  6  est  : 

4  =  0.250.000 

5  =  0.200.000 

6  =  0.166.666 


(1)  Messadaglia,  op.  cit.  (loc.  cit.),  p.  391. 
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D'où  la  moyenne  M  s==  0,205555. 

H      4.86o,  et  — ^  =  0.2035 
4.805 

8°  Enfin,  il  est  clair  que  si  l'on  divise  la  moyenne  contre- 
harmonique  par  l'harmonique  et  si  l'on  multiplie  le  quo 
tient  par  la  moyenne  harmonique,  on  obtient  comme  pro- 
duit la  moyenne  contre-harmonique. 

C.H  5.133 
1,055  x  4,863  =  3, 132375 

VI.  —  La  médiane. 

256.  Quand  on  range  une  série  de  variables  d'après  leur 
grandeur,  la  variable  qui  occupe  la  position  centrale  porte 
le  nom  de  médiane.  C'est  donc,  comme  dit  M.  Bowley,  «  la 
grandeur  qui  appartient  à  la  variable  qui  se  trouve  à  mi- 
chemin  de  la  série  (1)  »  ou,  comme  dit  Fechner,  «  la  gran- 
deur au-dessus  de  laquelle  et  au-dessous  de  laquelle  il  y  a 
un  même  nombre  de  termes,  en  sorte  qu'elle  divise  la  série 
par  le  milieu  (2)  ».  Notre  définition  est  à  peu  près  d'ac- 
cord avec  celle  de  M.  Yule  (3)  qui  nous  semble  la  plus  claire. 
Avec  le  même  auteur,  nous  ajouterons  que,  dans  une  con- 
struction graphique  reproduisant  la  courbe  des  fréquences 
(voir  ci-dessus  ce  qui  est  dit  de  la  distribution  des  fré- 
quences, chapitre  premier,  III),  la  médiane  coupe  le  gra- 
phique par  une  verticale  de  façon  à  diviser  l'aire  de  la 
courbe  en  deux  parties  égales. 

Pour  déterminer  l'emplacement  de  la  médiane,  il  faut 
procéder  comme  suit  : 

Si  le  nombre  de  variables  comprises  dans  la  série  est  un 
nombre  impair,  il  suffit  de  laisser  tomber  à  droite  et  à 


(1)  Eléments  of  statistics,  2e  édition,  p.  124. 

(2)  Kollektivniasslchre,  p.  13. 

(3)  An  introduction  to  Ihc  thcorij  of  statistics,  p.  ll(i. 
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gauche  un  nombre  égal  de  variables  et  d'attribuer  la  va- 
leur médiane  à  la  grandeur,  représentée  par  une  seule  va- 
riable, placée  entre  les  deux  groupes  ainsi  constitués;  un 
nombre  impair  de  termes,  ainsi  divisé  en  deux  parties,  peut 
s'écrire  2  n  —  1,  et  le  (n  —  1)"  terme  dans  l'ordre  des 
grandeurs  est  la  seule  variable  dont  la  grandeur  répondra 
à  la  définition  de  la  médiane. 

Si  le  nombre  de  variables  est  pair,  la  médiane  tombe 
entre  les  deux  groupements  égaux  qui  partagent  la  série. 
Lorsque  les  deux  grandeur»  voisines  sont  les  mêmes,  ce  qui 
peut  se  présenter  fréquemment,  car  dans  une  série  de  va- 
riables classées  d'après  leur  grandeur  on  observe  souvent 
des  répétitions,  il  n'y  a  point  de  difficulté;  mais  si  les 
deux  grandeurs  voisines  sont  différentes,  on  en  fait  la 
moyenne  et  c'est  à  cette  grandeur  moyenne  que  se  place  la 
médiane. 

Au  lieu  de  calculer  la  moyenne  des  grandeurs-limites 
des  deux  parties  qui  composent  la  série  entière,  on  peut 
aussi  recourir  à  un  procédé  simple  d'interpolation.  Le  re- 
cours à  ce  procédé  de  calcul  est  inutile  lorsqu'il  s'agit  de 
variables  rangées  l'une  après  l'autre  d'après  l'ordre  de 
leur  grandeur,  comme  dans  l'exemple  donné  au  numéro 
suivant  (longueur  de  94  amandes  classées,  une  à  une,  dans 
un  ordre  croissant).  Mais  les  exemples  d'un  autre  ordre 
sont  plus  fréquents  en  statistique.  D'habitude,  les  statis- 
tiques rangent  les  fréquences  dans  des  classes  d'un  certain 
intervalle,  comme  des  classes  de  salaires,  par  exemple 
(salaires  de  2  francs  à  fr.  2.49,  de  fr.  2.50  à  fr.  2.99,  etc.).  Si 
le  statisticien  pouvait  utiliser  le  matériel  original,  il  lui 
suffirait  de  compter,  à  l'intérieur  de  la  classe  où  se  trouve 
la  médiane,  un  nombre  d'unités  suffisant  pour  atteindre 
exactement  la  moitié  du  nombre  total  formant  la  série  et  le 
salaire  médian.  Malheureusement  il  n'en  est  pas  ainsi  dans 
le  cas  le  plus  ordinaire  et  il  faut  se  résoudre  à  interpoler. 
L'interpolation  à  laquelle  on  a  recours  est  basée  sur  l 'hy- 
pothèse que  la  distribution  des  fréquences  à  l'intérieur  de 
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la  classe  est  uniforme,  mais  ceci  n'est  qu'une  hypothèse 
qui  n'échappe  pas  toujours  à  de&  objections  fondées  :  La 
distribution  des  fréquences  dans  des  classes  assez  éten- 
dues n'est  certainement  pas  uniforme,  ainsi  qu'on  peut 
le  vérifier  dans  la  statistique  des  salaires  selon  que  les 
classes  de  salaires  sont  formées  de  divisions  par  vingt- 
cinq  ou  par  cinquante  centimes. 

257.  Pour  exposer  clairement  le  procédé  d'interpolation 
auquel  il  vient  d'être  fait  allusion,  il  y  a  lieu  de  recourir 
à  un  exemple. 

Exemple  17. 


Salaires  de  71,955  ouvriers  mâles  adultes  travaillant  au  fond, 
en  mai  1900,  dans  65  charbonnages  situés  en  Belgique. 


Taux 
des  salaires 

Nombre 
d'hommes  adultes 

du  fond  ayant 
touché  les  salaires 

ci-contre 

Taux 
des  salaires 

NOMBRK 

d'hommes  adultes 

du  fond  ayant 
touché  les  salaires 
ci-contre 

Moins  de 

1 

50 

8 

de  9 

.50 

à 

9 

.99 

240 

de  1.50  à 

1 

99 

119 

10 

.00 

à 

10 

49 

182 

2.00  à 

2 

49 

642 

10 

50 

à 

10 

99 

75 

2.50  à 

2 

99 

1,492 

11 

00 

à 

11 

49 

55 

3.00  à 

3 

49 

3,084 

11 

50 

à 

11 

99 

16 

3.50  à 

3 

99 

5,706 

12 

00 

à 

12 

49 

24 

4.00  à 

4 

49 

12,077 

12 

50 

à 

12 

99 

14 

4.50  à 

4 

99 

11,850 

13 

00 

à 

13.49 

10 

5.00  à 

5 

49 

7,716 

13 

50 

à 

13.99 

7 

5.50  à 

5 

99 

6,495 

14 

00 

à 

14 

49 

1 

6.00  à 

6 

49 

6,061 

14 

50 

à 

14 

99 

1 

6.50  à 

6 

99 

5,865 

15 

00 

à 

15 

49 

2 

7.00  à 

7 

49 

5,047 

15 

50 

à 

15 

99 

0 

7.50  à 

7. 

99 

2,612 

16. 

00 

à 

16 

49 

1 

8.00  à 

8. 

49 

1,318 

16 

50 

à 

16.99 

1 

8.50  à 

8. 

99 

771 

17 

00 

à 

17. 

49 

1 

9.00  à 

9. 

49 

461 

20. 

00 

à  20. 

49 

1 
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Le  nombre  total  des  ouvriers  dont  les  salaires  ont  été 
recueillis  est  de  71,955.  Le  nombre  médian  est  35,977.  En 
additionnant  les  fréquences  inscrites  dans  les  huit  pre- 
mières classes,  on  arrive  à  un-  total  de  34,978  ouvriers  ;  la 
classe  suivante  est  celle  des  salaires  de  5  francs  à  fr.  5.49 
et  c'est  dans  cette  classe  que  se  trouve  la  médiane.  Seule- 
ment, nous  ignorons  quel  est  le  vrai  chiffre  du  salaire  mé- 
dian; tout  ce  que  nous  pouvons  dire,  c'est  qu'il  est  compris 
entre  ces  limites  :  5  francs  à  fr.  5.49.  Pour  obtenir  une  ap- 
proximation plus  approchée,  on  procède  de  la  sorte  :  la 
classe  composée  de  7,716  ouvriers  étant  trop  vaste  et  dé- 
passant la  médiane  il  y  a  lieu  de  prendre  de  cette  classe 
seulement  le  nombre  d'ouvriers  nécessaire  pour  atteindre 
le  chiffre  de  35,977,  soit  999  ouvriers.  D'autre  part,  il  y  a 
lieu  de  préciser  l'intervalle  de  la  classe  et  de  prendre 
la  valeur  la  plus  élevée  de  la  classe  à  laquelle  on  doit  ajouter 
quelque  chose. 

On  a  donc  : 

999  1 

4.99  -f  ™-  •  ~  ou  0.0G47  =  5.05 
77  hi  2 

Le  salaire  médian  calculé  d'après  l'interpolation  ci- 
dessus  serait  donc  de  fr.  5.05;  d'après  la  moyenne  entre  la 
valeur  centrale  des  deux  classes,  le  salaire  serait  de  5  fr. 

'  — —  .  Le  salaire  moyen  calculé  en  tenant  compte  du 

nombre  des  fréquences  dans  chaque  classe,  excepté  dans  la 
première  où  le  salaire  gagné  par  chacun  des  huit  ouvriers 
qui  y  sont  compris  ne  peut  être  déterminé,  serait  de  f  r.  5.357 
ou  f  r.  5.36  ;  la  différence  avec  la  médiane  est  somme  toute 
sensible  mais  la  médiane  a,  sur  la  moyenne,  l'avantage 
d'être  calculée  très  rapidement  (1). 


(1)  Le  calcul  de  moyenne  ci-dessus  exige  40  minutes,  même  avec  l'aide  de 
procédés  mécaniques.  Pour  calculer  la  médiane,  il  faut  à  peine  la  dixième 
partie  de  ce  temps. 
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258.  La  médiane  est-elle  une  valeur  purement  abstraite, 
reposant  sur  une  donnée  conventionnelle,  ou  bien  est-elle 
une  mesure  résultant  de  la  nature  des  choses  et  conforme 
à  une  certaine  loi  de  distribution  par  grandeur,  quand  on 
analyse  un  certain  nombre  de  variables?  La  réponse  à  cette 
question  est  certes  importante.  On  peut  même  y  trouver  un 
intérêt  scientifique  de  premier  ordre,  car  si  les  procédés 
statistiques  peuvent  montrer  nettement  la  loi  de  distribu- 
tion à  laquelle  obéissent  les  variables,  ce  résultat  se  rap- 
proche sensiblement  de  cette  conception  fondamentale  de  la 
statistique  que  nous  avons  énoncée  dans  notre  Introduction 
en  disant  que  «  le  but  de  la  recherche  statistique  consiste 
à  exprimer  ce  que  le  phénomène  a  de  permanent  et  de  ty- 
pique. On  peut  dire  que  la  statistique,  méthode  propre  aux 
phénomènes  collectifs,  a  pour  objet  final  la  recherche  de 
l'absolu  parmi  le  relatif,  du  typique  parmi  l'accidentel,  du 
permanent  parmi  le  passager  ». 

Si  l'on  examine  un  à  un,  un  grand  nombre  d'exemplaires 
d'objets  d'une  même  espèce,  comme  les  feuilles  d'un  arbre, 
ou  des  fruits  d'une  certaine  sorte,  on  ne  manquera  pas  de 
remarquer,  comme  le  disent  Palin  et  Ethel  Elderton,  que 
ces  différents-  spécimens  se  différencient  entre  eux  d'une 
manière  sensible  :  parmi  les  feuilles  arrachées  à  cet  arbre, 
il  en  est  de  grandes  et  de  larges,  de  petites  et  d'étroites; 
les  fruits  servis  dans  la  corbeille  qui  orne  la  table  ne  sont 
pas  d'égale  grosseur.  Mais  il  ne  suffit  pas  de  cette  consta- 
tation banale  :  pour  arriver  à  dégager  une  conclusion  scien- 
tifique de  ce  fait,  il  faut  procéder  d'après  une  méthode  spé- 
ciale dont  nous  ferons  plus  loin  une  application  particulière. 

Cette  méthode  consiste  simplement,  après  avoir  mesuré 
les  variables  selon  tel  ou  tel  de  leurs  caractères  (longueur, 
épaisseur,  largeur)  à  les  ranger  les  unes  à  la  suite  des 
autres,  dans  un  ordre  croissant  et  à  représenter  au  moyen 
de  lignes  verticales,  placées  à  intervalles  égaux,  les  diffé- 
rentes grandeurs  obtenues  pour  chacune  des  variables.  Sir 
Francis  Galton  a  montré  de  la  sorte  les  grandeurs  d'une 
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série  de  cosses  de  pois  en  les  rangeant  dans  un  ordre  crois- 
sant et  en  les  photographiant  dans  cet  ordre,  toutes  en- 
semble. Mais  ce  procédé  ne  peut  s'appliquer  utilement  à 
toutes  les  variables,  à  cause  de  l'épaisseur  des  objets  qui 
ne  permettrait  pas  de  discerner  facilement  l'allure  de  la 
courbe  obtenue  de  la  sorte,  et  d'habitude  on  a  recours  au 
procédé  graphique  que  nous  avons  indiqué  ci-dessus.  Re- 
prenant l'exemple  donné  par  Palin  et  Ethel  Elderton,  nous 
avons  nous-même  procédé  à  une  expérience  qui  nous  sem- 
ble intéressante  et  dont  nous  demandons  au  lecteur  de 
suivre  ici  les  résultats. 

259.  Nous  avons  acheté  une  demi-livre  d'amandes  (va- 
riété commerciale  :  «  amandes  princesses  »)  dans  un  maga- 
sin de  Bruxelles;  les  amandes  ont  été  enlevées  d'un  bocal 
contenant  plusieurs  kilogrammes,  sans  aucun  choix;  les 
amandes  étaient  au  nombre  de  94.  Nous  les  avons  mesurées 
avec  soin  au  moyen  d'un  compas  d'épaisseur,  muni  d'un 
vernier  permettant  de  lire  le  dixième  de  millimètre.  Toutes 
les  mesures  reproduites  ci-après  sont  exprimées  jusqu'au 
dixième  de  millimètre.  Nous  avons  successivement  me- 
suré la  longueur  des  amandes,  puis  leur  épaisseur. 

En  même  temps  que  l'indication  des  longueurs,  il  était 
intéressant,  après  avoir  déterminé  la  position  de  la  mé- 
diane, de  calculer  les  écarts  de  chaque  variable  à  ce  point. 

C'est  ce  qui  est  réalisé  dans  le  tableau  suivant  : 


Exemple 


18.  —  Série  des  quatre-vingt-quatorze  amandes. 


N  unit:ros 
d'ord re 

Rcîirts 

E 

■  

Longueurs 

Numéros 
d'ordre 

Écarts 

e 

1 

!  Longueurs 

Numéro! 
d'ordre 

Écarts 
E 

Longueurs 

1 

-  0.71 

Centimèt. 

2  54 

32 

 - 

—  0.15 

Centimèt. 

3  10 

63 

+  0.09 

Cei  tiinèi. 
3  34 

2 

-  0.67 

2  58 

33 

-  015 

3  10 

64 

+  0  10 

3  35 

3 

-  0.63 

2  62 

34 

-  0  15 

3.10 

65 

+  0  14 

3.39 

4 

-  0  60 

2  65 

35 

-  0.13 

3  12 

66 

+  0.14 

3  39 

5 

-  0.58 

2  67 

36 

-  0.12 

3  13 

67 

+  0.18 

3  43 

6 

-  0  58 

2  67 

37 

—  0.11 

3.14 

68 

+  0.19 

3.44 

7 

-  0  56 

2  69 

38 

-  0  11 

3.14 

69 

+  0.23 

3.48 

8 

-  0  54 

2.71 

39 

-  0  10 

3.15 

70 

+  0  24 

3  49 

9 

-  0  49 

2.76 

40 

-  0.10 

3.15 

71 

+  0.27 

3.52 

10 

-  0  44 

2.81 

41 

-  0  07 

3-18 

72 

+  0.27 

3.52 

11 

-  0  40 

2.85 

42 

-  0.07 

3  18 

73 

+  0.29 

3.54 

12 

-  0.34 

2  91 

43 

-  0  04 

3  21 

74 

+  0  31 

3.56 

13 

-  0.34 

2. 91 

44 

—  0.03 

3  22 

75 

+  0  34 

3.59 

14 

-  0  33 

2  92 

45 

-  0.03 

3.23 

76 

+  0.34 

359 

15 

-  0.31 

2.94 

46 

-  0  01 

3.24 

77 

+  0  37 

3  62 

16 
17 

-  0.30 

-  0.30 

2  95 
2  95 

»47 
MU 
'48 

0.00 
0.00 

3  25 
3  25 

78 
79 

+  0.37 

+  0.38 

3  62 
3.63 

18 

-  0  30 

2  95 

49 

+  0.00 

3.25 

80 

+  0  39 

3. 64 

19 

-  0.26 

2  99 

50 

+  0  00 

3.25 

81 

+  0  39 

3  64 

20 

-  0.26 

2.99 

51 

+  0.01 

3. 26 

82 

+  0  40 

3.65 

21 

-  0.26 

2.99 

52 

+  0.03 

3. 28 

83 

+  0  41 

3  66 

22 

-  0.26 

2.99 

53 

+  0.04 

3.29 

84 

+  0  42 

3.67 

23 

-  0.25 

3.00 

54 

+  0.04 

3  29 

85 

+  0  44 

3.69 

24 

-  0.23 

3  02 

55 

+  0.04 

3.29 

86 

+  0  47 

3.72 

25 

-  0  21 

3.04 

56 

+  0.04 

3.29 

87 

+  0.49 

3  74 

26 

-  0  20 

3  05 

57 

+  0.05 

3  30 

88 

+  0  49 

3.74 

27 

-  0.20 

3.05 

58 

+  0.06 

3  31 

89 

+  0.50 

3-75 

28 

—  0.18 

3. 07 

59 

_|_  o.06 

3  31 

Qfl 

Ï7\J 

I    n  n 
T  li  OJ 

3  82 

29 

.-  0  18 

307 

60 

+  0.08 

3  33 

91 

+  0  57 

3  82 

30 

-  0.17 

3.08 

61 

+  0.08 

3.33 

92 

+  0  71 

3.96 

31 

-  0  15 

3.10 

62 

+  0.09 

3.34 

93 
94 

+  0.71 
+  0.75 

3  96 
4.00 

S  (E)  =  - 


1.260. 
Ï.238. 
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Distribution  de  94  amandes 
d'après  leur  longueur. 


Q<  Q'a 


La  régularité  de  la 
série  est  remarquable. 
La  médiane  se  fixe  aux 
nos  47  et  48,  endroit  au- 
quel correspond  la  lon- 
gueur de  3  c.  25  mm.; 
la  moyenne  arithméti- 
que est  :  3.2498,  soit  un 
écart  de  deux  dix-mil- 
lièmes seulement  avec 
la  médiane;  la  somme 
des  écarts  positifs  et 
négatifs  par  rapport  à 
la  médiane  est  respec- 
tivement de  1260  et 
1258.,  exprimés  en 
dixièmes  de  millimètre. 


Distribution  de  54  amandes 
d'après  leur  longueur. 


Fig.  23. 

260.  Maintenant,  il 
serait  intéressant  de 
constater  si  cette  mé- 
diane se  trouverait  for- 
tement modifiée  par 
l'introduction  du  ha- 
sard. Dans  le  but  de 
faire  cette  constatation, 
nous  avons  tiré  au  sort 
54  amandes,  parmi  les 
94  qui  ont  servi  à  la  pre- 
mière expérience  :  afin 
de  conserver  à  l'élé- 
ment hasard  toute  sa  valeur,  nous  n'avons  pas  extrait  les- 
amandes  elles-mêmes,  mais  nous  avons  tiré  les  numéros 
d'ordre  correspondant  à  la  première  série  au  moyen  de 
boules  comportant  une  suite  ininterrompue  de  94  numéros. 
Voici  les  résultats  de  cette  expérience. 


Fig.  24. 
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Exemple  19.  —  Série  des  cinquante-quatre  amandes  tirées  au  hasard 


N°  d'ordre 

Longueur 

N°  d'ordre 

Longueur 

N°  d'ordre 

Longueur 

(1) 

(1) 

(1) 

Centimètres 

Centimètres 

Centimètres 

2 

2.58 

33 

3.10 

62 

3.34 

3 

2.62 

34 

3.10 

64 

3  35 

4 

2.65 

35 

3.12 

65 

3.39 

6 

2.67 

36 

3.13 

68 

3.44 

7 

2.69 

38 

3  14 

69 

3.48 

9 

2.76 

41 

3.18 

70 

3.49 

12 

2.91 

43 

3.21 

72 

3.52 

15 

2.94 

46 

3.24 

74 

3.56 

16 

2.95 

Mé.  1 47 

j  48 

3.25 

75 

3.59 

18 

2.95 

3  25 

76 

3  59 

19 

2.99 

50 

3.25 

77 

3.62 

21 

2.99 

5] 

3.26 

78 

3.62 

22 

2.99 

53 

3.29 

79 

3.63 

24 

3.02 

55 

3.29 

81 

3.64 

25 

3.04 

56 

3.29 

82 

3.65 

28 

3.07 

57 

3.30 

83 

3.66 

30 

3.08 

59 

3.31 

85 

3.69 

31 

3.10 

61 

3.33 

86 

3  72 

La  médiane  a  donc  comme  valeur  3  c.  25  mm.,  alors  que 
la  moyenne  calculée  sur  les  54  termes  se  fixe  à  3  c.  2225. 


261.  On  peut  faire  un  Distribution  de  45  amandes 

nouvel  essai  en  tirant,  d'aPrés  leur  lon3ueur- 

au  hasard,  un  nombre  ; 
plus  restreint  de  boules  — 


d'un  jeu  de  loto,  qua- 
rante-cinq par  exemple, 
dont  les  chiffres  corres- 
pondraient à  ceux  des 
numéros  d'ordre  des  94 
termes    composant  la 


première    série.   Nous  Fig.  25. 


(1)  Les  numéros  correspondent  à  l'ordre  des  grandeurs  indiqué  au  tableau 
précédent  (exemple  18). 
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avons  fait  cette  troisième  expérience,  qui  confirme  entière- 
ment les  résultats  des  deux  premières. 

Voici  les  données  : 


Exemple  20.  —  Série  de  quarante-cinq  amandes  tirées  au  hasard 




N°  d'ordre 

Longueur 

N°  d'ordre 

Longueur 

N°  d'ordre 

Longueur 

Centimètres 

Centimètres 

Centimètres 

] 

2.54 

40 

3.15 

66 

3.39 

2 

2  58 

42 

3.18 

67 

3.43 

4 

2.65 

44 

3.52 

63  • 

3.44 

7 

2.69 

46 

3.24 

69 

3.48 

10 

2.81 

47 

3.25 

70 

3.49 

11 

2.85 

49 

3,25 

72 

3.52 

13 

2.31 

50 

3.25 

75 

3.59 

15 

2.94 

Mé.  52 

3.28 

76 

3.59 

16 

2.95 

54 

3.29 

79 

3.63 

17 

2.95 

56 

3.29 

80 

3.64 

25 

3.04 

57 

3.30 

81 

3.64 

31 

3.10 

58 

3.31 

86 

3.72 

32 

3.10 

61 

3.38 

88 

3.74 

36 

3.13 

62 

3  34 

89 

3.75 

38 

3.14 

65 

3.39 

91 

3.82 

Nous  obtenons  comme  valeur  de  la  médiane  3  c.  28  mm.  ; 
la  moyenne  arithmétique  donne  comme  valeur  typique  de 
la  série  3  c.  2515. 

Les  données  qui  précèdent  mettent  bien  en  vue  la  valeur 
représentative  de  la  médiane;  les  mesures  simplement  ob- 
tenues à  l'aide  de  la  médiane  ne  s'écartent  pas  sensible- 
ment de  celles  résultant  du  calcul  de  la  moyenne  ;  de  plus, 
elles  ne  sont  pas  fort  différentes  quoiqu'on  opère  sur  la 
série  entière  ou  sur  des  séries  plus  limitées  dont  les  termes 
sont  désignés  au  hasard  par  un  tirage.  On  peut  répéter  des 
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expériences  du  même  genre  en  prenant  pour  sujets  les 
feuilles  d'un  arbre,  le  nombre  de  fèves  ou  de  pois 
contenus  dans  une  série  de  gousses,  etc.,  etc.  Les  gra- 
phiques en  regard  permettent  de  suivre  entièrement  les 
résultats  de  l'expérience.  Le  lecteur  ne  manquera  pas  de 
remarquer  combien  l'allure  de  la  courbe  dessinée  par  la 
succession  des  variables  reste  identique  dans  les  différents 
cas. 

De  même  qu'on  détermine  la  médiane  par  la  position  de 
la  valeur  centrale,  on  peut  calculer  la  valeur  des  quar- 
tiles  et  des  déciles  placés  à  l'endroit  correspondant  au 
quart  et  au  dixième  du  nombre  des  termes.  L'usage  des 
quartiles  et  des  déciles  sera  exposé  plus  loin  à  l'endroit  où 
il  sera  traité  de  la  déviation  type  ou  standard  déviation. 

262.  Le  calcul  de  la  médiane  exige  un  nombre  raisonnable 
de  termes,  rigoureusement  homogènes  quant  à  leur  objet. 
Si  la  série  renferme  un  nombre  de  termes  insuffisant,  la 
médiane  ne  serait  pas  calculée  dans  de  bonnes  conditions. 
La  répétition  trop  fréquente  de  la  même  mesure  dans  une 
série  de  variables  est  aussi  une  condition  défectueuse  pour 
la  recherche  de  la  médiane,  bien  que  quelques  répétitions 
ne  puissent  toujours  être  évitées. 

Lorsqu'une  série  d'observations  est  formée  de  la  réunion 
de  deux  séries  partielles,  la  moyenne  de  la  série  compie. 
peut  être  trouvée  en  combinant  ensemble  les  moyennes  sépa- 
rées des  deux  séries  particulières,  c'est-à-dire  en  multi- 
pliant chaque  moyenne  séparée  par  le  nombre  de  variables 
comprises  dans  la  série,  en  additionnant  les  résultats  par- 
tiels et  en  divisant  le  total  par  le  nombre  total  de  tous  les 
termes.  (Cfr.  n°  250.) 

Supposons  que  la  série  des  94  amandes  soit  formée  de 
deux  séries  particulières  constituées  parmi  la  série  géné- 
rale en  sélectionnant  un  groupe  de  45  amandes  et  un  autre 
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groupe  de  49  amandes  (1).  Nous  avons,  d'après  les  résul- 
tats des  variables  comprises  dans  chaque  série  : 

1°  45  amandes  avec  une  moyenne  de  3  c.  3335  (longueur 
moyenne)  ; 

2°  49  amandes  avec  une  moyenne  de  3  c.  1728  (longueur 
moyenne)  ; 

La  moyenne  générale  est  égale  à  : 

\  K(\  M  _J_  1  KK  fil 

94  .  M  =  (45  x  3.3335)  +  (49  x  3.1728)  =  94  =  3.249 

moyenne  qui  résulte  de  la  série  complète,  comme  nous 
l 'avons  montré  au  n°  254  qui  précède. 

Mais  nous  ne  pouvons  procéder  à  un  calcul  semblable  en 
ce  qui  concerne  les  médianes  de  nos-  deux  séries  particu- 
lières, car  en  multipliant  la  médiane  par  le  nombre  de 
termes  de  la  série,  on  ne  reconstitue  pas,  comme  c'est  le 
cas  avec  la  moyenne  arithmétique,  le  nombre  total  des  uni- 
tés comprises  dans  la  série;  toutefois,  un  calcul  de  l'espèce 
se  rapprocherait  d 'autant  plus  de  la  moyenne  que  la  courbe 
des  deux  séries  particulières  serait  plus  étroitement  symé- 
trique :  nous  avons  déjà  dit  que  dans  une  distribution 


(1)  Cette  sélection  a  été  faite  tout  naturellement  et  en  suivant  seulement 
les  lois  du  hasard,  car  en  achetant  les  amandes  qui  ont  servi  à  notre 
expérience,  nous  avions  eu  soin  de  faire  peser  deux  fois  un  quart  de  livre;  ta 
première  série  contenait  45  amandes,  la  seconde  49.  Voici  la  répartition  des 
longueurs  pour  chacune  des  séries  : 


PREMIÈRE  SÉRIE 

DEUXIÈME  SÉRIE 

2,67 

3,14 

3,33 

3,64 

2,54 

2,95 

3,14 

3,35 

2,76 

3,15 

3,34 

3,64 

2,58 

2,95 

3,15 

3,39 

2,91 

3,18 

3,34 

3,67 

2,62 

2,99 

3,18 

3,43 

2,94 

3,21 

3,39 

3,69 

2,65 

2,99 

3,25 

3,54 

2,99 

3,22 

3,44 

3,74 

2,67 

3,00 

3,25 

3,56 

2,99 

3,22 

3,48 

3,74 

2,69 

3,04 

3,25 

3,59 

3,02 

3,24 

3,49 

3,75 

2,71 

3,05 

3,28 

3,62 

3,05 

3,25 

3,52 

3,96 

2,81 

3,07 

3,29 

3,65 

3,07 

3,26 

3,52 

4,00 

2,85 

3,10 

3,29 

3,66 

3,08 

3,29 

3,59 

2,91 

3,10 

3,30 

3,72 

3,12 

3,29 

3,62 

2,92 

3,10 

3,31 

3,82 

3,13 

3,31 

3,63 

2,95 

3,10 

3,33 

3,82 
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idéalement  symétrique,  la  moyenne,  la  médiane  et  le  mode 
se  fixent  au  même  point;  l'écart  même  de  ces  différentes 
mesures  peut  être  pris  comme  un  indice  de  la  symétrie  de 
la  courbe  elle-même.  Ainsi,  les  deux  séries  particulières 
étant  dans  notre  exemple  à  peu  près  symétriques,  la  me- 
sure des  deux  médianes  obtenues  (3,25  et  3,28)  donne  une 
mesure  type  très  rapprochée  (3,265)  de  la  médiane  générale 
(3,250),  mais  qui  ne  se  confond  pa&  avec  celle-ci. 

263.  La  médiane  ne  peut  être  déterminée  dans  toute  sé- 
rie quelconque,  mais  seulement  dans  celles  qui  groupent 
des  données  individuelles  entre  un  certain  nombre 
de  classes,  par  exemple  les  salaires  gagnés  par  les  ou- 
vriers d'une  certaine  profession,  la  stature  des  hommes 
d'un  régiment,  etc.  La  condition  essentielle  pour  que  la  mé- 
diane puisse  être  calculée,  est  que  les  unités  dp  la  série 
soient  rangées  les  unes  à  la  suite  des  autres  d'après  leurs 
dimensions. 

Lorsque  la  série  est  composée  de  nombres  proportion- 
nels ou  de  moyennes,  l'usage  de  la  médiane  est  interdit, 
parce  que  les  poids  correspondant  à  chaque  donnée  ne  sont 
pas  égaux  entre  eux.  Les  coefficients  de  mortalité  calculés 
pour  une  série  de  groupes  professionnels,  peuvent,  il  est 
vrai,  être  rangés  selon  leur  ordre  d'importance,  mais  nous 
ne  pouvons,  sous  cette  forme,  en  déterminer  le  centre.  <(  Le 
centre  actuel  de  la  série,  dit  Zizek,  est  situé  plus  haut  ou 
plus  bas  que  la  donnée  centrale,  selon  que  les  données  infé- 
rieures ou  supérieures  concernent  des  quantités  plus  consi- 
dérables et  sont  par  conséquent  de  poids  plu&  grand  (1).  » 
Cette  observation  ne  vise,  bien  entendu,  que  des  nom- 
bres proportionnels  pris  sur  des  données  différentes  ou 
qui  se  rapportent  à  plusieurs  époques;  elle  ne  s'applique 
pas  aux  nombres  proportionnels  calculés  sur  un  ensemble 
de  données  homogènes  :  dans  ce  cas,  les  chiffres  propor- 


(1)  Zizek,  Statistical  avcrages,  p.  204. 
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tionnels  conservent  la  même  portée  que  les  nombres  abso- 
lus et  peuvent  être  utilisés  au  même  titre  que  ceux-ci. 

En  effet,  en  utilisant  les  pourcentages,  au  lieu  des  nom- 
bres absolus,  dans  l'exemple  que  nous  avons  reproduit  plus 
haut  (salaires  de  71,955  ouvriers  mineurs  Cfr.  n°  257)  on  ob- 
tient, à  la  classe  de  salaires  fr.  4.50  à  4.99,  une  proportion 
totale  de  48.61  p.  c.  d'ouvriers;  il  faut  donc  ajouter  à  cette 
proportion,  1.-38  p.  c.  d'ouvriers  appartenant  à  la  classe 
suivante  pour  arriver  aux  50  p.  c.  où  se  place  la  médiane  ; 

or  :         4.99  +  1.38  %  =  4.99  +  0.06  =-■  5  fr.  05  c, 

résultat  auquel  on  était  déjà  arrivé  en  utilisant  les  nombres 
absolus.  (Cfr.  n°  257.) 

264.  On  peut  résumer  comme  suit  les  avantages  et  les  in- 
convénients des  médianes.  Au  nombre  des  avantages  de  la 
médiane,  on  peut  signaler  : 

1°  La  manière  exacte  dont  on  peut  la  localiser; 

2°  La  facilité  et  la  rapidité  des  calculs  à  l'aide  desquels 
on  la  détermine,  avantages  qu'elle  partage  avec  la  moyenne 
arithmétique,  en  ce  qui  concerne  la  facilité  et  où  elle  se 
montre  supérieure  à  la  moyenne  si  l'on  envisage  la  rapi- 
dité ; 

3°  Mais  ce  qui  rend  la  médiane  précieuse,  c'est  surtout 
ce  fait  qu'il  n'est  pas  nécessaire  de  connaître  la  valeur  des 
termes  extrêmes  si  l'on  connaît  leur  nombre  et  si  l'on  sait 
que  leur  valeur  ne  dépasse  pas  une  certaine  limite.  Or,  ces 
conditions  se  présentent  très  fréquemment  en  statistique. 
Dans  les  statistiques  de  salaires,  on  ne  donne  généralement 
pas  de  détails  sur  les  salaires  inférieurs  à  une  certaine 
somme,  on  se  borne  à  indiquer  le  nombre  d'ouvriers  ga- 
gnant un  salaire  inférieur  à  tel  chiffre  (1)  ;  de  même,  on 


(1)  Les  statisticiens  devraient  prendre  pour  règle  de  toujours  donner  les 
extrêmes  et  d'adopter  un  mode  d'énumération  complète.  L'inconvénient  qu'on 
fait  valoir  pour  s'écarter  de  cette  règle  est  le  trop  grand  nombre  de  colonnes. 
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n'énumère  pas,  en  général,  tous  les  salaires,  jusqu'au  plus 
élevé,  mais  on  donne  le  nombre  global  d'ouvriers  recevant 
un  salaire  supérieur  à  tel  chiffre.  Or  la  médiane  s'accom- 
mode de  ces  renseignements  sommaires,  tandis  que  la 
moyenne  ne  s'y  prête  pas.  Le  calcul  de  la  moyenne 
sur  ces  bases  rencontre  des  difficultés  parce  que  l'une  des 
classes,  la  dernière,  est  illimitée,  de  sorte  qu'on  ne  peut 
simplement  avoir  recours  à  l'hypothèse  d'après  laquelle  les 
salaires  se  répartiraient,  par  groupes  égaux,  entre  les  li- 
mites de  la  classe  (1). 

Il  n'y  a  pas  que  les  statistiques  publiées  dans  ces  con- 
ditions qui  se  prêtent  à  l'emploi  de  la  médiane  tandis 
qu'elles  se  refusent  à  celui  de  la  moyenne;  il  y  a  encore  à 
signaler  la  facilité  que  la  médiane  apporte  à  l'exécution  de 
certaines  enquêtes  :  dans  une  statistique  des  revenus,  par 
exemple,  ce  sont  les  classes  extrêmes  qui  sont  surtout  diffi- 
ciles à  déterminer  :  les  très  petits  revenus,  à  cause  de  leur 
nombre,  de  leur  variété  et  de  leur  incertitude  ;  les  très  gros, 
à  cause  de  la  résistance  que  l'enquête  rencontrera.  Le  re- 
venu moyen  ne  pourrait  être  fixé  avant  d'avoir  surmonté 
toutes  ces  difficultés  ;  pour  le  revenu  médian,  il  suffirait  de 
connaître  le  nombre  de  revenus  au-dessous  et  au-dessus 
d'un  certain  chiffre,  ce  qui  peut  être  obtenu  sans  difficulté 
(nombre  de  revenus  inférieurs  à  1,000  francs,  nombre  de 
revenus  supérieurs  à  500,000  francs)  ; 

4°  La  moyenne  se  trouverait  fortement  influencée  par  la  . 
présence  ou  l'adjonction  d'un  terme  très  différent  de  ceux 
de  la  série;  la  médiane  ne  marquerait,  dans  ce  cas,  qu'une  j 
sensibilité  fort  relative.  Supposons  une  série  de  49  revenus  | 


L'Office  du  Travail  de  Belgique  a  trouvé  une  solution  à  cette  difficulté  en 
publiant  en  note  les  salaires  extrêmes  qui  se  trouvaient  totalisés  dans  la 
première  et  la  dernière  colonne. 

(1)  Pourtant,  en  admettant  que  la  série  suive  la  courbe  de  la  loi  asymé- 
trique de  GADSSj  on  peut  déterminer  la  moyenne  d'une  série  dont  les  extré- 
mités sont  illimitées.  Mais,  par  la  simplicité  et  la  rapidité  de  la  détermination 
du  point  caractéristique,  l'emploi  de  la  médiane  est  à  préférer  à  tout  autre. 
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montant  ensemble   à  490,000  francs;  on  a  la  moyenne 

490,000        ,n'nnn's  v  ,  . 

— ^ —  =  10,000  irancs  ;  a  ces  revenus  s  ajoute  celui  d  un 

millionnaire  possédant  500,000  francs  de  revenu;  on  a  la 

490,000  +  500,000 
nouvelle  moyenne   —   =  19,800  francs.  Au 

contraire,  la  médiane  ne  serait  modifiée  que  de  peu;  avec 
49  revenus,  elle  se  fixerait  à  la  classe  correspondant  au 
25e  revenu;  l'adjonction  du  revenu  du  millionnaire  oblige- 
rait seulement  le  statisticien  à  adopter,  pour  la  médiane, 
la  moyenne  entre  le  25e  et  le  26e  revenu,  soit  une  différence 
à  peu  près  insignifiante  avec  le  chiffre  obtenu  d'abord. 
Pour  l'appréciation  du  revenu  d'une  collectivité,  la  mé- 
diane serait  donc  beaucoup  plus  exacte  que  la  moyenne,  car 
il  importe  peu  à  49  possesseurs  d'un  revenu  médiocre  qu'à 
leur  nombre  vienne  s'ajouter  un  seul  millionnaire. 

265.  Parmi  les  inconvénients  de  la  médiane,  on  peut  si- 
gnaler : 

1°  En  multipliant  la  médiane  par  le  nombre  de  termes, 
on  ne  reconstitue  pas  le  total  de  la  série  et,  par  conséquent, 
l'addition  de  deux  médianes  relatives  à  deux  séries  particu- 
lières ne  donne  pas  le  même  résultat  que  la  recherche  de  la 
médiane  opérée  sur  une  série  unique  formée  des  mêmes  uni- 
tés, —  théorème  que  nous  avons  démontré  plus  haut.  (Cfr. 
n°  250.)  ; 

2°  La  médiane  ne  tient  presque  pas  compte  des  varia- 
tions extrêmes,  de  sorte  que  son  emploi  est  limité  aux  cas 
où  ces  variations  peuvent  être  négligées  sans  inconvénient. 
On  préférera  la  médiane  pour  l'estimation  du  revenu  d'une 
collectivité  :  on  aura  plutôt  recours  à  la  moyenne  s'il  s'agit 
d 'établir  un  prix  de  revient  ; 

3°  Elle  n'est  pas  applicable  à  toutes  les  séries,  notam- 
ment à  celles  qui  se  composent  de  nombres  proportionnels 
calculés  sur  des  masses  différentes,  ou  aux  séries  chrono- 
logiques, ou  aux  séries  composées  de  moyennes; 
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4"  On  ne  peut  non  plus  rechercher  la  médiane  qu'à  la  con- 
dition que  les  termes  de  la  série  puissent  être  rangés  dans 
l'ordre  de  leur  grandeur.  Au  contraire,  l'ordre  dans  lequel 
sont  placés  les  termes  servant  au  calcul  de  la  moyenne  et 
les  changements  qui  peuvent  s'opérer  dans  cet  ordre,  n'ont 
aucune  influence  sur  la  moyenne. 

Cependant,  dans  l'ensemble,  la  somme  des  avantages 
l'emporte  sur  celle  des  inconvénients  et  ceci  est  particu- 
lièrement exact  en  ce  qui  concerne  l'étude  de  la  répartition 
des  revenus  et  des  salaires. 

VII.  —  La  dominante  (mode). 

266.  Le  professeur  Pearson  a  proposé,  en  1895,  de  don- 
ner le  nom  de  «  mode  »  à  la  valeur  d'une  série  désignée 
par  l'abscisse  correspondant  à  l'ordonnée  de  fréquence 
maximum  (1).  Cette  valeur  a  d'abord  été  désignée  par  des 
auteurs  français  sous  le  nom  de  «  valeur  normale  »  ou  sim- 
plement ((  normale  »,  puis  plu&  tard,  par  l'expression  «  la 
dominante  »  ;  Jes  Italiens  lui  donnent  le  nom  de  ((  norma  », 
les  Allemands  celui  de  «  dichtestes  Wert  »  (2).  Il  peut  pa- 
raître avantageux  de  conserver  le  nom  que  lui  a  donné  le 
professeur  Pearson,  afin  de  maintenir  l'unité  de  termino- 
logie, et  pour  le  motif  que  le  terme  «  mode  »  est  employé 
par  les  statisticiens-mathématiciens  de  l'école  anglaise 
dont  les  travaux  doivent  être  constamment  consultés  et  sui- 
vis dans  la  matière  qui  nous  occupe.  Mais,  en  français,  l'ex- 
pression «  mode  »  n'a  aucun  sens  qui  se  rapproche  de 
celui  que  nous  envisageons  ici,  et,  sur  la  suggestion  de 
M.  Lucien  March,  nous  avons  décidé  d'adopter  l'expression 
«  la  dominante  ». 

Avant  tout,  il  s'agit  de  définir  la  dominante  d'une  façon 


(1)  Peauson  (K.),  Skew  Variation,  etc.,  loc.  cit.,  p.  345,  note. 

(2)  Zizek  (F.),  Statistical  averages,  p.  322. 
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un  peu  plus  détaillée,  de  reconnaître  exactement  sa  valeur, 
de  se  faire  une  idée  des  avantages  qu'elle  réunit. 

La  dominante  est,  de  toutes  les  valeurs  composant  une 
série,  celle  qui  se  présente  avec  la  fréquence  la  plus^élevée 
et  autour  de  laquelle  les  autres  valeurs  se  groupent  avec 
la  densité  la  plus  forte.  Autrement  dit,  la  dominante  cor- 
respond à  la  classe  la  plus  élevée  de  la  série  et  les  classes 
qui  l'avoisinent  à  gauche  et  à  droite  ont  une  fréquence 
moins  élevée  qu'elle.  Il  suit  de  là  que,  dans  une  série 
régulière,  reproduisant  d'une  manière  plus  ou  moins  par- 
faite la  courbe  normale  des  erreurs,  la  dominante  se  trouve 
au  centre  et  le  point  auquel  elle  se  fixe  correspond 
à  celui  où  se  placent  la  moyenne  et  la  médiane. 
Dans  une  courbe  idéale,  les  trois  points  se  confon- 
draient en  un  seul,  mais  comme  nous  l'avons  dit  plus  haut, 
il  n'y  a  presque  aucun  phénomène  physique  ou  économique 
dont  la  courbe  reproduise  exactement  celle  des  erreurs  et 
même  ceux  qui  s'en  rapprochent  d'une  façon  sensible  sont 
relativement  rares  ;  il  en  est,  au  contraire,  un  grand  nombre 
qui  semblent  obéir  à  une  loi  de  distribution  asymétrique 
rappelant,  de  plus  ou  moins  loin,  la  courbe  normale.  Aussi 
n'est-il  pas  rare  de  constater  dans  une  série  la  présence 
d'un  grand  nombre  de  sommets,  alors  que  la  courbe  nor- 
male ou  modérément  asymétrique  n'en  contiendrait  qu'un 
seul.  Il  a  donc  été  nécessaire  de  trouver  des  méthodes  qui 
permissent  d'absorber  les  différents  sommets  en  une  série 
plus  régulière,  qui  n'en  contient  qu'un  seul;  ces  procédés 
seront  exposés  plus  loin. 

267.  Tandis  que  la  moyenne  est  une  abstraction  mathé- 
matique, la  dominante  correspond  à  l'idée  générale  que  se 
font  la  majorité  des  gens  lorsqu'on  demande  de  définir  une 
situation  usuelle  ou  normale.  Si  l'on  interroge  un  chef 
d'entreprise  ou  un  dirigeant  de  syndicat  au  sujet  du  sa- 
laire moyen  que  gagne  dans  ses  ateliers  ou  dans  la  profes- 
sion représentée  par  le  syndicat,  un  ouvrier  mâle  adulte, 
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ni  l'un  ni  l'autre  ne  songera  à  procéder  à  un  calcul  lent  et 
minutieux;  si  nous  analysons  leur  travail  mental,  nous  ver- 
rons que  pour  trouver  la  réponse  à  notre  question,  ils  com- 
menceront par  ne  pas  tenir  compte  des  jeunes  ouvriers  qui 
n'ont  pas  encore  atteint  le  complet  développement  de  leurs 
capacités  physiques  et  techniques,  et  ils  élimineront  de 
même  les  vieux  ouvriers  qui  ne  jouissent  plus  de  leur  puis- 
sance de  travail  intégrale  ;  ils  ne  songeront  pas  davantage 
aux  salaires  exceptionnellement  élevés  que  gagnent  quel- 
ques spécialistes  ou  des  ouvriers  d'une  habileté  exception- 
nelle. Ils  auront  en  vue  le  plus  grand  nombre  des  ouvriers 
qui  répondent  au  type  professionnel  dans  l'industrie  en 
question  et  ils  répondront  :  «  en  moyenne,  l'ouvrier  de  telle 
industrie  gagne  x  francs  ».  Le  chiffre  cité  ne  coïncidera 
probablement  pas  avec  la  moyenne,  parce  que  celle-ci  tient 
compte  de  tous  les  salaires,  des  plus  faibles  comme  des 
plus  élevés,  mais  le  chiffre  donné  a  des  chances  d'être  assez 
près  de  la  dominante,  c'est-à-dire  de  la  valeur  de  plus 
grande  densité. 

Il  est  permis  de  dire  que  la  dominante  se  rapproche  plus 
de  la  conception  vulgaire  de  la  «  moyenne  »  que  la  moyenne 
arithmétique  elle-même.  Si  nous  considérons  avec  attention 
les  procédés  arithmétiques  étudiés  au  cours  de  ce  chapitre, 
nous  voyons  que  leur  utilité  principale  est  de  nous  fournir 
la  mesure  typique  d'un  ensemble  complexe  de  faits  que 
nous  voudrions  évaluer  au  moyen  d'une  expression  simple. 
Or,  dans  un  grand  nombre  de  cas,  nous  aurions  avantage  à 
connaître  ce  qui  se  présente  le  plus  souvent,  la  mesure  de  plus 
grande  densité,  plutôt  que  le  résultat  d'un  calcul  qui  n'est 
qu'une  simple  conception  arithmétique.  Dans  un  magasin 
de  confections,  le  marchand  se  basera  plutôt  sur  les  mesures 
les  plus  fréquentes  parmi  les  personnes  qui  composent  sa 
clientèle  que  sur  la  moyenne  proprement  dite;  le  quod 
pleruwque  fit  est  pour  lui  une  règle  plus  sûre  que  la 
moyenne,  et  ses  prévisions  se  rapporteront  à  «  la  domi- 
nante »  de  préférence  à  toute  autre  conception  synthétique. 
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268.  Quant  aux  avantages  que  présente  la  dominante, 
on  peut,  avec  MM.  King  et  Bowley  (1)  les  résumer  comme 
suit  : 

1"  La  dominante  est  un  procédé  utile  à  employer  chaque 
fois  qu'il  est  désirable  de  ne  pas  tenir  compte  des  varia- 
tions exceptionnelles.  —  Parmi  les  ouvriers  d'un  atelier, 
en  général,  d'une  capacité  inférieure  et  ne  gagnant  qu'un 
salaire  médiocre,  il  s 'en  rencontre  par  hasard  quelques-uns 
d'une  grande  activité  qui  gagnent,  en  travaillant  aux 
pièces,  beaucoup  plus  que  leurs  camarades.  Si  l 'on  calcule  le 
salaire  moyen  des  ouvriers  de  cet  atelier,  on  devra  tenir 
compte  des  salaires  exceptionnels  de  ces  ouvriers  d'élite 
et  la  moyenne  en  sera  augmentée  d'autant.  Au  contraire 
dans  le  calcul  de  la  dominante,  on  cherchera  à  déterminer 
dans  quel  groupe  de  salaires  on  trouve  le  plus  grand  nom- 
bre de  travailleurs,  résultat  sur  lequel  la  présence  de  quel- 
ques ouvriers  plus  favorisés  ne  peut  exercer  d'influence. 

Si  l'on  voulait  comparer  les  salaires  dans  une  même  in- 
dustrie, à  deux  époques  différentes,  peut-être  serait-il 
préférable  de  choisir  la  dominante  plutôt  que  la  moyenne, 
car  ce  dernier  résultat  serait  influencé  par  la  présence  de 
taux  extrêmes,  très  bas  ou  fort  élevés,  qui  peuvent  exister 
ou  disparaître  sans  modifier  d'une  manière  sensible  la  con- 
dition économique  de  la  masse  des  ouvriers.  Le  choix  de  la 
dominante  répond  donc  à  une  objection  faite  fréquemment 
à  l'emploi  de  la  moyenne  en  ce  qui  concerne  les  salaires  (2). 


(1)  King  (W.),  Eléments  of  statistical  method,  New  York,  1912,  p.  125.  — 
Bowley  (A.  L.),  Eléments  of  statistics,  p.  123. 

(2)  M.  Bowley  propose  (loc.  cit..  p.  123)  un  exemple  emprunté  aux  collectes 
qui  se  font  dans  les  églises  pour  les  besoins  du  culte  et  que  nous  nous 
permettons  de  développer  quelque  peu.  Un  curé  de  village,  désireux  de  se 
rendre  compte  du  produit  des  collectes  faites  aux  différents  offices  du 
dimanche,  ferait  mieux  de  se  baser  sur  la  dominante  que  sur  la  moyenne; 
aux  messes  matinales,  il  constatera  par  exemple  que  l'offrande  des  fidèles  est, 
le  plus  souvent,  de  la  plus  petite  pièce  de  monnaie,  tandis  qu'aux  messes 
qui  se  célèbrent  plus  tard  et  sont  surtout  fréquentées  par  des  personnes 
aisées  de  la  paroisse,  les  décimes  sont  en  majorité.  Supposons  que  parmi  les 
hôtes  occasionnels  de  ce  village,  se  trouve  un  châtelain  qui  verse  cinq  ou 
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2°  Pour  déterminer  la  dominante  d'une  manière  appro- 
chée, il  n'est  pas  nécessaire  d'avoir  des  données  précises 
concernant  les  termes  extrêmes  de  la  série  ;  il  suffit  de  sa- 
voir qu'ils  sont  peu  nombreux;  —  bien  entendu,  il  faut 
qu'il  s'agisse  des  termes  extrêmes  de  la  série  — ;  on  peut  se 
contenter  d'une  approximation,  ou  d'un  degré  de  précision 
qui  permette  de  déterminer  le  maximum  atteint  par  la  fré- 
quence. Par  contre  la  dominante  ne  peut  être  connue 
d'une  façon  exacte  que  si  tous  les  termes  sont  connus. 

Dans  une  série  de  salaires,  si  nous  ne  voulons  pas  attein- 
dre un  haut  degré  d'exactitude,  il  ne  faut  pa&  connaître 
nécessairement  le  nombre  d'ouvriers  qui  gagnent  les  sa- 
laires, rangés  par  classe,  en  dessous  d'un  certain  taux, 
quand  ce  nombre  est  peu  important,  ni  le  nombre  de  ceux, 
dénombrés  par  classes,  qui  gagnent  un  salaire  supérieur  à 
un  certain  taux-limite.  Puisque  nous  admettons  a  priori  que 
leur  nombre  est  peu  important,  il  est  impossible  que  la  do- 
minante change  de  place.  Au  contraire,  pour  déterminer  le 
chiffre  de  la  moyenne,  la  dernière  précision  est  nécessaire. 
Cette  facilité  qu'offre  le  mode  est  précieuse,  parce  que  les 
séries  statistiques  reproduites  dans  les  publications  offi- 
cielles ne  donnent  que  rarement  les  données  précises  jus- 
qu'à la  dernière  classe  mais  elle  est  moins  étendue  qu'en 
ce  qui  concerne  la  médiane  : 

3°  Enfin,  la  dominante  donne  une  valeur  réelle,  la  valeur 
la  plus  fréquente  de  la  série,  de  façon  qu'elle  répond  bien  à 
ce  que  veut  exprimer  la  notion  vulgaire  de  moyenne.  —  Au 


dix  francs  à  la  collecte  de  la  grand'messe  :  la  dominante  ne  sera  pas  changée, 
mais  bien  la  moyenne;  et  si,  par  hasard,  un  jour  de  chasse,  le  châtelain 
assiste  à  la  première  messe  et  donne  son  offrande  habituelle,  la  moyenne  de 
la  collecte  sera  changée  encore  plus,  tandis  que  la  dominante  ne  sera  pas 
modifiée.  Or,  c'est  sur  une  situation  habituelle  que  le  curé  doit  tabler  pour 
le  budget  de  son  église  et  il  fera  bien  de  ne  pas  utiliser  dans  ce  but  la 
moyenne  influencée  par  la  générosité  d'un  hôte  de  passage;  la  dominante, 
c'est-à-dire  le  nombre  habituel  de  paroissiens  qui  versent  à  la  collecte  2,  5, 
10  ou  50  centimes,  lui  fournira  une  base  d'appréciation  sensiblement  plus 
juste. 


•426 


PRINCIPES   DE  STATISTIQUE 


contraire,  la  moyenne  mathématique  répond  à  une  con- 
ception idéale,  qui  ne  trouve  peut-être  aucune  réalisation  en 
pratique.  Il  se  peut  très  bien  que  la  moyenne  du  salaire 
d'un  ouvrier,  ou  des  appointements  d'un  employé  ne  cor- 
responde au  salaire  effectif  d'aucun  ouvrier  ou  d'aucun 
employé  compris  dans  la  série,  ce  qui  est  assez  déroutant 
pour  qui  ne  se  rend  pas  exactement  compte  de  la  notion 
■de  «  moyenne  ». 

269.  Il  existe  plusieurs  procédés  pour  déterminer  la  po- 
sition de  la  dominante. 

Le  calcul  peut  atteindre  la  grande  précision  si,  connais- 
sant tous  les  termes,  on  utilise  les  courbes  de  Pearson. 

Mais,  en  général,  on  s'en  tient  à  des  procédés  approxi- 
matifs. Nous  résumerons  en  premier  lieu  les  deux  mé- 
thodes de  M.  Bowley,  puis  la  formule  de  M.  Pear- 
son; quant  aux  procédés  graphiques,  nous  en  dirons  un 
mot  au  chapitre  consacré  à  la  statistique  graphique  à 
l'endroit  où  nous  parlerons  des  moyens  de  trouver  la  mé- 
diane. 

Pour  trouver  la  dominante  (mode),  on  peut,  d'après 
M.  Bowley,  procéder  comme  suit  :  on  commence  par  ranger 
les  classes  dans  un  ordre  régulier  allant  du  minimum  au 
maximum,  en  ayant  soin  d'observer  que  les  classes  aient 
la  même  grandeur  :  le  contraire  arrive  fréquemment  quand 
on  utilise  un  matériel  publié  par  un  bureau  de  statistique. 

En  regard  de  chaque  classe,  on  note  les  fréquences  cor- 
respondantes et  on  examine  la  série  ainsi  formée.  Si  l'on 
a  affaire  avec  une  série  régulière,  obéissant  à  la  loi  nor- 
male des  erreurs,  il  n'y  aura  guère  de  difficulté  et  la  domi- 
nante se  découvrira  d'elle-même.  Mais  les  séries  régulières 
sont  rares,  comme  nous  l'avons  déjà  dit  plusieurs  fois  et, 
dans  la  réalité,  ce  sont  les  séries  asymétriques  qui  l'em- 
portent :  celles-ci  ont  plusieurs  sommets  et  le  tracé  gra- 
phique qu'on  en  fait  ressemble  assez  bien  à  une  chaîne  do 
montagnes,  dont  les  pics,  plus  ou  moins  groupés  autour 
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d'un  massif  central,  sont  séparés  par  de  profondes  vallées. 
Les  séries  irrégulières,  peut-on  dire  encore,  sont  en  dent» 
de  scie. 

270.  M.  Bowley,  dans  l'exemple  qui  lui  sert  d'illustra- 
tion, trouve  14  maxima  dans  la  série  ;  dans  le  cas  que  nous 
citons  ci-après,  on  peut  compter  15  sommets  différents, 
dont  le  plus  élevé  correspond  au  chiffre  1209. 

Exemple  21. 


Salaires  de  10,455  ouvriers  mâles  de  plus  de  16  ans,  en  octo- 
bre 1903,  dans  l'industrie  de  la  construction  de  machines  motri- 
ces, machines  outils,  et  appareils  industriels,  en  Belgique  fl). 


CLASSE 
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SALAIRES 

Nombre 
d'ouvriers 
dans  la 
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ci-contre 
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DES 

SALAIRES 

Nombre 
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1 
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4 
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99 
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1 
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5 
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5 
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5 

25 
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49 
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(1)  Salaires  et  durée  du  travail  dans  les  industries  des  métaux,  octobre  1903. 
Publication  de  l'Office  du  Travail  de  Belgique,  Bruxelles,  1907. 
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271.  Il  s'agit  de  substituer  à  cette  série  extrêmement 
irrégulière,  une  série  se  rapprochant  de  la  normale.  Dans 
ce  but,  on  procède  comme  suit  :  on  débute  par  grouper  deux 
à  deux  les  fréquences,  en  commënçant  par  la  classe  inscrite 
en  tête  du  tableau  et  si  l'on  trouve  plusieurs  a  modes»,  on  con- 
tinue le  groupement  par  deux  en  commençant  par  la  classe 
suivante  (la  seconde).  On  procède  de  même  en  groupant  les 
classes  trois  par  trois,  en  commençant  par  la  première, 
puis  par  la  seconde,  enfin  par  la  troisième.  Si  la  régularité 
n'est  pas  encore  obtenue,  on  continue  en  réunissant  les 
classes  quatre  par  quatre.  Dans  l'exemple  donné  par 
M.  Bowley,  il  reste  quatre  «  modes  »  quand  on  opère  le  pre- 
mier et  le  second  groupement,  trois  au  troisième,  quatre  au 
quatrième,  deux  au  cinquième,  deux  au  sixième  et  seule- 
ment un  au  septième  groupement.  Si  l'on  s'arrête  au 
sixième  groupement,  dont  un  des  deux  modes  ne  présente 
guère  d'importance,  on  se  trouve  devant  une  classe  fort 
étendue  comprenant  cinq  classes  du  tableau  primitif. 
M.  Bowley  propose,  pour  réduire  l'étendue  de  cette  classe, 
une  méthode  qu'on  peut  définir  comme  suit  :  augmenter 
d'une  unité  le  nombre  de  classes  à  considérer  et  commen- 
cer le  groupement  par  une  classe  située  un  degré  plus  bas 
que  le  point  de  départ  du  groupement  précédent  ;  continuer 
en  opérant  sur  une  base  de  même  étendue  et  en  descendant 
chaque  fois  d'un  degré  jusqu'à  ce  que  la  limite  inférieure 
atteigne  le  degré  supérieur  de  la  classe  qu'il  s'agit  de  dé- 
composer. 

Le  «  mode  »  peut  être  fixé  approximativement  à  la  moitié 
de  la  classe  comprenant  la  fréquence  la  plus  élevée.  Dans  le 
cas  cité  par  M.  Bowley,  cette  fréquence  étant  2012  et  la 
classe  correspondante  étant  celle  des  salaires  de  $  1.05  à 
$  1.55,  le  mode  peut  être  placé  aux  environs  de  $  1.25  à 
$  1.34,  c'est-à-dire  $  1.30. 

M.  Bowley  signale  une  autre  méthode  approximative  de 
déterminer  le  «  mode  »,  qui  a  de  commun  avec  la  première 
toutes  les  opérations  préliminaires  de  groupement,  mais 
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qui  en  diffère  par  le  choix  final.  Lorsque  le  mode  le  plus 
important  varie  quand  la  limite  la  plus  basse  de  la  classe 
vient  à  changer,  on  peut  en  conclure  que  le  groupement  par 
classe  est  trop  restreint  et  on  peut  passer  à  un  groupement 
plus  étendu.  Lorsque,  par  exemple,  on  a  déterminé  les 
sommets  au  moyen  du  groupement  par  trois  classes  à  la 
fois,  on  doit  voir  si  l'une  des  classes  est  comprise  dans  les 
trois  points  déterminés  à  l'aide  de  ce  groupement  et  le 
groupe  le  plus  petit  peut  être  pris  comme  contenant  le 
mode. 

272.  Nous  prenons  comme  exemple  la  série  des  salaires 
des  ouvriers  des  ateliers  de  construction  de  machines  mo- 
trices, machines-outils,  etc.,  en  octobre  1903,  en  Belgique, 
mais  nous  sommes  tenté  de  trouver  que  la  tâche  est  trop 
facile  car  dès  le  premier  groupement  par  deux  (0.25  à  0.49  ; 
0.50  à  0.74,  etc.)  nous  obtenons  une  série  absolument  régu- 
lière, dont  la  dominante  fixée  au  point  fr.  4.00  à  4.24  est 
confirmée  par  le  second  groupement  par  deux  classes  à  la 
fois.  Il  n'est  donc  pas  douteux,  dès  les  premières  varia- 
tions, que  la  dominante  soit  contenue  dans  les  limites  fr.  4.00 
à  4.24,  soit  fr.  4.12  environ. 

La  série  I  est  :  15,  103,  288,  461,  756,  1512,  1729,2135, 
1550,  1005,  453,  224,  etc. 

La  série  II  est  :  26,197,  354,  574,  1026,  1657,  1955,  1938, 
1291,  718,  373,  163,  etc. 

La  classe  des  salaires  de  fr.  4.00  à  4.24  étant  com- 
prise dans  les  deux  maxima,  il  est  certain  que  le  mode 
s'y  trouve  contenu.  Aussi,  pour  avoir  une  série  per- 
mettant de  pousser  l'analyse  jusqu'au  bout,  avons-nous  dû 
intervertir  l'ordre  de  certaines  fréquences,  mais  en  pre- 
nant soin  de  ne  modifier  ni  la  médiane,  ni  la  moyenne.  La 
série  hypothétique  que  nous  avons  ainsi  construite  com- 
prend les  données  :  957,  926  (au  lieu  de  700),  1029,  700  (au 
lieu  de  926),  729,  821,  470,  183  (au  lieu  de  535),  535  (au  lieu 
de  183),  etc.  (le  reste  comme  dans  la  série  originale). 
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Le  tableau  suivant  présente  l'arrangement  des  données, 
ainsi  constituées. 

Exemple  22. 

Salaires  de  10,455  ouvriers  des  ateliers  de  construction 
de  machines  motrices,  etc.,  en  Belgique.  (Octobre  1903.) 

DÉTERMINATION  DE  LA  DOMINANTE. 
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La  série  originaire  comprend  13  sommets  dont  le  plus 
typique  est  1209.  En  sériant  une  première  fois  les  données 
deux  à  deux,  il  reste  deux  sommets  :  le  second  groupement 
par  deux  en  donne  aussi  deux  qui  ne  coïncident  pas. 
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avec  les  premiers,  de  telle  sorte  que  nous  sommes  forcé  de 
recourir  à  un  groupement  plus  étendu.  En  groupant  par 
trois,  nous  n'avons  plus  qu'un  mode,  mais  ce  mode  change 
chaque  fois  qu'on  descend  d'un  degré  en  commençant  la 
sériation.  M.  Bowley  pose  alors  la  règle  suivante  :  entre 
les  trois  modes,  choisir  celui  qui  est  le  plus  petit  et  fixer  le 
mode  à  peu  près  au  milieu  de  la  classe  centrale  ;  dans  notre 
exemple,  ce  mode  est  2759,  la  classe  fr.  4.25  à  fr.  4.49  et 
l'emplacement  du  mode  4.37  environ.  Si  donc  on  demande 
quel  est  le  salaire  le  plus  habituel  parmi  les  ouvriers  belges 
des  ateliers  de  construction  de  machines,  on  pourrait  ré- 
pondre que  ce  salaire  varie  de  fr.  4.25  à  4.49. 

273.  La  méthode  de  M.  Bowley  est  assez  peu  précise; 
nous  voyons  par  l'exemple  même  qu'il  donne  que  le  mode 
varie  d'une  classe  selon  qu'on  emploie  la  première  ou  la 
seconde  méthode.  M.  Pearson  a  donné  une  autre  méthode 
approximative  qu'on  peut  résumer  de  la  sorte  : 

1°  Calculer  la  moyenne  de  la  série  ; 

2°  Calculer  la  médiane  de  la  série; 

3°  On  a  le  mode  =  la  moyenne  —  3  (moyenne  —  mé- 
diane), c'est-à-dire  que  le  mode  se  trouve  placé  du  côté  de 
la  médiane,  à  une  distance  de  celle-ci  qui  équivaut  au 
double  de  la  distance  entre  la  médiane  et  la  moyenne,  ou 
que  la  distance  entre  la  moyenne  et  la  médiane  égale  le 
tiers  de  la  distance  entre  la  moyenne  et  le  mode. 

Soit  l'exemple  suivant  (1)  : 

Pourcentage  de  la  population  secourue  en  Angleterre  et 
dans  le  pays  de  Galles  : 


(1)  Yule,  «  Notes  on  the  history  of  pauperism;  supplementary  note  on  the 
détermination  of  the  mode  ».  (Journal  of  the  Roy.  Stat.  Soc,  1896,  p.  343.  ) 
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Année  1891,  moyenne  =  3,289 
médiane  =  3,195 

différence  =  0,094 

3,289  —  (3  X  0,094)  =  3,007  (1) 
car  0,094  X  3  =  0,282 
et  3,289  —  0,282  =  3,007 

Le  mode  «  idéal  »  serait  :  2,987  ou  2,99.  - 

274.  Si  la  dominante  réunit  de  nombreux  avantages,  elle 
présente  aussi  quelques  inconvénients,  parmi  lesquels  le 
principal  est  de  ne  pouvoir  être  calculée  avec  une  précision 
véritable  par  des  procédés  simples.  Les  mesures  qui  en 
sont  données  sont  souvent  basées  sur  une  recherche  empi- 
rique n'aboutissant  qu'à  un  résultat  approximatif.  Au  con- 
traire, la  moyenne  peut  être  connue  avec  la  dernière  préci- 
sion en  employant  des  procédés  élémentaires.  La  re- 
commandation que  fait  M.  Yule  à  cet  égard  est  significa- 
tive :  «  La  moyenne  arithmétique,  dit-il,  doit  être  employée 
invariablement,  à  moins  qu'il  n'existe  une  raison  très  pré- 
cise en  faveur  du  choix  d'une  autre  forme  et  le  commen- 
çant fera  bien  de  se  limiter  à  la  recherche  de  la  moyenne 
arithmétique.  »  Et  il  ajoute  :  «  S'il  y  a  de  bonnes  raisons 
pour  rechercher  le  «  mode  »  en  outre  de  la  moyenne,  il  n'en 
est  pas  moins  vrai  que  le  «  mode  »  ne  peut  remplacer  la 
moyenne.  ))  La  dominante  enfin  renseigne  une  situation  de 
fait,  mais  elle  n 'implique  aucune  idée  de  partage  égal  comme 
c'est  le  cas  pour  la  moyenne.  Si  nous  calculons  le  revenu 
moyen  d'un  groupe  bien  défini,  la  valeur  moyenne  nous 
fait  connaître  quel  serait  le  revenu  de  chacun  si  la  distribu- 
tion des  revenus  était  faite  sur  une  base  uniforme  :  le 
mode  ne  ferait  que  nous  indiquer  le  revenu  le  plus  usuel 
parmi  les  membres  de  la  communauté  dont  il  s'agit.  Il 


(1)  G.  U.  Yule,  An  introduction  to  the  theory  of  statistics,  p.  121. 
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importe  donc  de  bien  poser  le  problème  et  d'examiner 
avant  tout  la  nature  exacte  de  la  réponse  qu'on  désire 
obtenir.  De  ce  qui  précède,  se  dégage  encore  le  corollaire 
suivant  :  en  multipliant  la  moyenne  par  le  nombre  d 'unités, 
on  reconstitue  le  total,  ce  qui  n'est  pas  exact  si,  au  lieu  de 
la  moyenne,  on  emploie  la  dominante. 
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CHAPITRE  III 
La  dispersion  et  ses  mesures 

I.  —  La  nature  de  la  dispersion. 

276.  Par  dispersion,  on  entend,  d'une  manière  générale, 
le  manque  d'uniformité  des  termes  de  la  série,  par 
rapport  à  la  moyenne  ou  à  une  autre  expression  géné- 
rale de  la  série.  Lorsqu'une  série  se  compose  d'uni- 
tés classées  d'après  leur  grandeur,  comme  des  soldats 
rangés  par  degré  de  taille,  des  ouvriers  groupés  selon  le 
taux  de  leur  salaire,  on  observe  que  les  termes  extrêmes 
sont  dans  les  différents  cas  plus  ou  moins  différents  de  la 
moyenne.  Si  tous  les  termes  de  la  série  étaient  égaux,  ou  à 
peu  près,  ils  prendraient  tous  place  dans  la  môme  classe  et 
il  n'y  aurait  plus  de  dispersion  du  tout;  s'ils  ne  différaient 
pas  beaucoup,  il  ne  faudrait  que  quelques  classes,  voisines 
l'une  de  l'autre,  pour  les  contenir  tous  et  la  dispersion 
serait  restreinte.  Ainsi,  la  série  des  ouvriers  adultes  em- 
ployés dans  l'industrie  de  la  construction  de  machines  mo- 
trices, machines-outils  et  appareils  industriels  (Cfr.  ex.  21, 
n"  270)  présente  une  grande  dispersion;  par  contre,  dans 
l 'exemple  des  91  amandes  (Cfr.  ex.  18,  n°  259),  la  dispersion 
est  restreinte  ainsi  que  le  montre  le  tableau  ci-après  : 

Exemple  1. 

Dimensions  des  amandes  Nombre  d'amandes. 

Centimètres 

2.50  à  2.74. 
2.75  à  2.99. 
3.00  à  3.24. 
3.25  à  3.49. 
3.50  à  3.74. 
3.75  à  3.99. 


8 
14 
24 
24 
18 

5 
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On  conçoit  l'utilité  de  déterminer  une  mesure  exacte  de 
la  dispersion,  tant  pour  caractériser  la  nature  d'une  série 
particulière  que  pour  comparer  plusieurs  séries  diffé- 
rentes. Nous  restons  donc  exactement  dans  la  matière  de  ce 
livre  second,  qui  a  trait  aux  procédés  d'analyse  du  matériel 
statistique. 

277.  Avant  de  passer  aux  procédés  de  calcul,  il  est  utile 
de  se  bien  pénétrer  de  la  notion  de  la  dispersion. 

Les  hommes  d'une  compagnie  tirent  sur  une  cible;  on 
relève  la  trace  des  balles  qui  ont  porté  ;  bien  que  tous  aient 
visé  le  centre  de  la  cible,  ce  but  n'a  pas  été  atteint  par  tous 
les  soldats  —  les  uns  s'en  sont  écartés  de  peu,  les  autres 
de  beaucoup.  En  notant  les  coups,  on  obtient  l'expression 
de  la  dispersion  des  balles  dans  la  cible. 

Des  ouvriers  sont  employés  dans  une  industrie; 
supposons  que  ce  soit  l'industrie  de  la  construction 
des  machines  d'un  pays  déterminé,  à  une  date  fixée. 
Les  uns  gagnent  un  faible  salaire,  d'autres  un  salaire  élevé, 
le  plus  grand  nombre  un  salaire  intermédiaire  entre  les 
extrêmes.  La  répartition  des  ouvriers  d'après  le  taux  de 
salaire  fournit  le  matériel  nécessaire  à  l'étude  de  la  disper- 
sion des  salaires  dans  cette  industrie. 

On  dit  que  la  dispersion  est  étendue  lorsque  les  termes 
de  la  série  s'écartent  beaucoup  de  la  grandeur  moyenne. 
Elle  est  restreinte  lorsque  les  différences  avec  la  moyenne 
sont  atténuées. 

Il  est  clair  que  le  résultat  du  tir  ou  le  fait  de  gagner  un 
salaire  déterminé  n'est  pas  l'effet  du  hasard.  Chaque  ti- 
reur, stimulé  par  l'émulation  qui  règne  entre  les  concur- 
rents, s'efforce  de  placer  sa  balle  au  centre;  une  circon- 
stance extrinsèque  joue  un  rôle  important  :  la  justesse  de 
î  'arme,  son  réglage  plus  ou  moins  complet  ;  il  faut  ensuite 
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faire  la  part  des  conditions  intrinsèques  telles  que  le  coup 
d'œil,  le  calme,  la  sûreté  du  tireur,  etc.,  bref  ce  qui  caracté- 
rise le  tireur  adroit.  La  réalisation  plus  ou  moins  parfaite 
de  ces  conditions,  ou  leur  absence,  se  traduisent  finale- 
ment dans  le  résultat  du  tir.  Ce  résultat  est  plus  ou  moins 
bon  selon  que  les  circonstances  agissantes  ont  formé  un 
ensemble  favorable  ou  non.  Des  balles  tirées  très  loin  du 
centre  marqueront  qu'il  y  a  dans  la  compagnie  quelques 
soldats  fort  nerveux  ou  peu  expérimentés  (si  l'on  a  tous 
ses  apaisements  sur  la  valeur  des  armes).  Un  grand  nom- 
bre de  balles  avoisinant  le  centre  fera  supposer  qu'il  y  a 
une  bonne  moyenne  de  tireurs  au  courant  de  cet  art,  et  un 
autre  groupe  situé  en  dehors  des  premiers  cercles  de  la 
cible  donnera  à  penser  qu'il  existe  encore  pas  mal  de  no- 
vices. Si  l'on  peut  caractériser,  par  certains  procédés  de 
calcul,  la  dispersion  des  termes  de  la  série,  on  aura  rendu 
un  grand  service  aux  chercheurs  et  on  aura  donné  à 
l'homme  d'étude  l'expression  synthétique  dont  il  a  be- 
soin. Telle  est  l'utilité  des  mesures  de  dispersion,  dans  son 
expression  la  plus  générale. 

278.  La  notion  de  dispersion  apparaît  plus  claire  encore 
lorsqu'on  choisit  un  exemple  emprunté  à  la  vie  sociale, 
par  exemple  la  distribution  des  salaires  dans  un  groupe 
déterminé  d'ouvriers.  Reprenons  les  chiffres  donnés  à 
notre  exemple  21  (chap.  II,  n"  270),  mais,  pour  simplifier, 
donnons  les  variations  des  salaires  de  cinquante  en  cin- 
quante centimes,  tels  qu'ils  sont  déterminés  à  l'exemple  22, 
3e  colonne. 
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Exemple  2.  —  Salaires  de  10,455  ouvriers  des  ateliers  de  construc- 
tion de  machines  motrices,  etc  ,  en  Belgique,  octobre  1903. 

(Matériel  extrait  de  la  statistique  des  salaires  dans  les  industries  des  métaux, 
publication  de  l'Office  du  Travail  de  Belgique.) 


Classes  de  salaires 

Nombre 
d  ouvriers 

Classes  de  salaires 

Nombre 
d'ouvriers 

0  25  à  0.74 

15 

6.25  à  6.74 

102 

0.75  à  1.24 

103 

6.75  à  7.24 

51 

1.25  à  1.74 

288 

7.25  à  7.74 

28 

1.75  à  2  24 

461 

7.75  à  8.24 

14 

2.25  à  2.74 

756 

8.25  à  8.74 

4 

2.75  à  3.24 

1512 

8.75  à  9.24 

4 

3.25  à  3.74 

1955  | 

9.25  à  9.74 

2 

3.75  à  4.24 

1909 

9.75  à  10.24 

6 

4.25  à  4.74 

1550 

10  25  à  10.74 

6 

4.75  à  5  24 

653 

10.75  à  11.24 

6 

5.25  à  5.74 

805 

11.25  à  11.74 

C 

5.75  à  6.24 

224 

11.75  à  il. 99 

1 

Cette  distribution  des  salaires  d'un  groupe  important 
d'ouvriers  confirme  les  observations  que  M.  Lucien  March 
présentait  (1),  à  propos  des  courbes  de  distribution  des 
salaires,  à  savoir  :  1°  les  salaires  sont  concentrés  autour 
d'une  valeur  normale  ;  il  y  a  donc  une  tendance  au  maintien 
du  taux  du  salaire  d'un  type  déterminé;  2°  à  mesure  que 
les  salaires  augmentent,  leur  dispersion  à  partir  de  la  va- 
leur normale  et  la  dissymétrie  de  la  courbe  de  distribution 
augmentent  également.  L'accroissement  de  la  dispersion 
ne  s'opère  pas  d'une  manière  symétrique.  La  courbe  de  dis- 
tribution se  déforme,  non  pas  comme  si  toute  la  masse 
de&  ouvriers  participait  en  même  temps  à  la  hausse  des  sa- 
laires, mais  comme  s 'il  y  avait  un  effort,  une  tendance  con- 


(1)  March  (L).,  «  Quelques  exemples  de  distribution  des  salaires  ».  (Jour- 
nal dp  la  Société  de  statistique  de  Paris,  1898,  pp.  202-203.) 
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stante,  venant  des  ouvriers  à  salaires  élevés,  en  sorte  que 
l'écart  entre  la  moyenne  et  la  normale  tend  à  s'accroître 
constamment. 

Il  paraît  inutile,  après  ces  exemples,  d'insister  sur  l'uti- 
lité d'une  formule  représentative  de  la  dispersion  des  phé- 
nomènes sociaux. 

279.  L'idée  qui  se  présente  à  première  vue  pour  donner 
une  expression  synthétique  de  la  dispersion  est  de  considé- 
rer l'écart  entre  les  termes  extrêmes  rapporté  à  la 
grandeur  moyenne  de  la  série.  Ce  procédé  doit  être 
repoussé  pour  une  raison  bien  simple;  c'est  qu'il  ne 
s'agit  pas  uniquement  de  classes,  mais  aussi  de  fré- 
quences dans  chaque  classe.  Ainsi  dans  l'exemple  pré- 
cédent, la  dispersion  se  trouverait  notablement  moindre 
si  l'on  supprimait  seulement  25  ouvriers  sur  le  total  de 
10,455 ;  elle  s'arrêterait,  en  effet,  à  la  limite  fr.  8.74,  au  lieu 
de  comprendre  encore  7  classes  de  fr.  0.50  pour  aller  jus- 
qu'à fr.  11.99.  L'addition  de  quelques  cas  exceptionnels 

représentant  suffirait  donc  à  augmenter  la  grandeur 

\  U4oo 

de  la  dispersion  dans  de  fortes  proportions. 

Aussi  les  mesures  adoptées  pour  caractériser  la  disper- 
sion d'une  série  sont-elle&  empruntées  à  d'autres  éléments. 
Nous  les  examinerons  successivement.  Elle  peuvent  se  ra- 
mener à  trois  types  qui  sont  : 

La  moyenne  de  la  déviation  (1)  ; 

La  déviation  type  ; 

La  méthode  des  quartiles. 

On  peut  y  ajouter  : 

Le  coefficient  de  variation  et  la  dissymétrie  ou  «  Skew- 
ness  ». 


(1)  On  pourrait  dire  aussi  la  moyenne  des  écarts,  mais  cette  appellation 
prêterait  à  confusion,  parce  que  la  somme  des  écarts,  avec  leurs  signes,  étant 
égale  à  zéro,  leur  moyenne  serait  aussi  égale  à  zéro.  Le  mot  déviation  évite 
ce  malentendu  et  il  présente  l'avantage  de  respecter  la  terminologie  employée 
par  ceux  qui  ont  introduit  l'expression  en  statistique. 
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II.  —  Moyenne  de  déviation. 

280.  Des  différentes  mesures  de  la  dispersion,  la  moyenne 
de  déviation  est  la  plus  simple  et  la  plus  rapidement  cal- 
culée. On  a  vu  plus  haut  ce  qu'on  entend  par  «  écarts  »  et 
l'on  a  démontré  que  la  somme  algébrique  des  écarts  à  la 
moyenne  arithmétique  est  égale  à  zéro.  Mais,  si  au  lieu  de 
donner  aux  écarts  leurs  signes  propres,  on  les  considère 
tous  comme  étant  de  signe  positif,  on  obtient  alors  une  va- 
leur positive,  qui,  divisée  par  le  nombre  de  termes,  prend 
le  nom  de  moyenne  de  déviation  (mean  déviation). 

Cette  moyenne  de  déviation,  désignée  habituellement  par 
la  lettre  A  peut  se  calculer  d'après  des  écarts  pris  par  rap- 
port à  la  moyenne  ou  à  toute  autre  mesure.  Cependant,  il 
est  recommandé  de  calculer  les  écarts  des  nombres  à  la  mé- 
diane, de  préférence  à  toute  autre  mesure.  En  effet, 
comme  Laplace  l'a  démontré  en  1818  déjà,  la  moyenne  de  la 
;  déviation  est  la  plus  petite  possible  quand  on  utilise  la  mé- 
diane comme  point  de  comparaison. 

Pour  calculer  la  moyenne  de  déviation  d'une  série  com- 
posée de  nombres  sans  distribution  de  grandeur,  il  n'y  a 
qu'à  se  rappeler  les  règles  de  calcul  de  la  médiane. 

Nous  avons  dit  plus  haut  (Cfr.  n°  256)  que  si  le  nombre 
de  variables  est  impair,  il  suffit  de  laisser  tomber  à  droite 
et  à  gauche  un  nombre  égal  de  variables  et  d'attribuer  la 
valeur  médiane  à  la  grandeur,  représentée  par  une  seule 
variable,  placée  entre  les  deux  groupes  ainsi  constitués,  les 
grandeurs  étant  placées  dans  leur  ordre  naturel. 

La  moyenne  de  déviation  s'exprime  au  moyen  de  la  for- 
mule suivante  : 

v(m  —  Mé)  Zdm 
b.T,  -  i  -  '  ou   (27) 


Soient  les  nombres,  déjà  utilisés  pour  des  exemples  an- 
térieurs :  19,  25,  26,  28,  32,  33,  40.  Par  la  simple  inspection 
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des  nombres,  nous  voyons  que  la  médiane  est  28.  Nous 
avons  donc  : 

Exemple  3. 


19  ... 

...  Xi 

9 

23 

3 

26  ... 

...  x?) 

2 

28  ... 

0 

32  ... 

...  x5 

4 

33      .    .  . 

5 

40  ... 

12 

Xn 

3^î~ 

A  =^=  s 

La  moyenne  arithmétique  des  mêmes  nombres  est  29. 
Calculant  la  moyenne  de  déviation  en  adoptant  cette  base 
de  la  moyenne,  ainsi  qu'on  l'a  fait  à  l'exemple  précédent, 
nous  avons  : 

Exemple  4. 
19  .... 

25  .... 

26  .... 
28  .... 

32  .... 

33  .... 


A  =  36 
7 

La  moyenne  de  déviation  est  donc  ici  trouvée  plus  petite 
quand  on  la  calcule  d'après  la  médiane  que  quand  on  la 
prend  par  rapport  à  la  moyenne,  résultat  conforme  à  la 
théorie  (1). 


10 

xt 

4 

x3 

3 

x^ 

1 

x5 

3 

Xq 

4 

X; 

11 

Xn 

36 

I 

5,412 

(1)  La.  moyenne  de  déviation  a  un  rapport  direct,  comme  on  le  verra  plu9 

loin,  avec  la  standard  déviation,  ou  déviation-type.  Il  existe  un  moyen  rapide 

de  contrôler,  l'un  par  l'autre,  les  résultats  du  calcul  :  en  effet,  la  moyenne  de 

déviation  représente  environ  les  4/5  de  la  standard  déviation.  Le  rapport 

moyenne  de  déviation  (d'après  médiane) 

entre  les  deux  valeurs  est  donc  :  

déviation  type. 

On  reviendra  sur  ce  point  au  n°  280. 
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281.  Donnons  encore  un  exemple  d'après  une  série  com- 
posée de  nombres  se  succédant  l'un  l'autre.  D'après  le 
tableau  inséré  au  n°  259,  nous  avons  vu  que,  pour 
94  amandes,  dont  la  longueur  avait  été  soigneusement  me- 
surée, nous  avons  trouvé  que  les  écarts  à  la  médiane 
étaient  : 

1.260  +  1.258.  Nous  avons  donc  : 

v  Ï.Î60  -f  1.-258 

1  xn  =   ~   -=  0.0267 

moyenne  de  déviation. 

La  règle  précédente  est  excessivement  simple.  Elle  n'est 
pas  plus  compliquée  quand  la  médiane  doit  être  calculée 
sur  une  série  de  nombres  pairs  :  nous  avons  indiqué  la  ma- 
nière de  procéder  à  la  détermination  de  la  médiane  dans  un 
tel  cas  (Cfr.  n°  256).  Rappelons  qu'on  peut  procéder,  soit  en 
prenant  la  moyenne  des  deux  variables  formant  les  extré- 
mités médianes  des  deux  groupes  qui  partagent  la  série,, 
soit  en  ayant  recours  à  un  procédé  d'interpolation. 

282.  Mais  un  grand  nombre  de  séries  statistiques  sont 
composées  de  variables  ayant  des  fréquences  différentes, 
dans  ce  cas,  comment  convient-il  de  procéder1? 

Il  paraît  naturel,  à  première  vue,  d'établir  les  calculs 
comme  on  le  ferait  s'il  s'agissait  de  déterminer  simplement 
les  écarts  à  la  moyenne  arithmétique;  cependant,  ce  pro- 
cédé ne  conduirait  à  aucun  résultat.  La  méthode  à  employer 
est  celle  que  nous  avons  appelée  méthode  indirecte  (Cfr. 
n°  230)  dans  laquelle  l 'éloignement  de  la  classe  de  chaque 
variable  à  la  moyenne  est  la  mesure  de  l'importance  des 
écarts. 

On  peut  donc  formuler  la  règle  d'une  manière  très  sim- 
ple :  la  moyenne  de  déviation  est  la  somme  des  déviations 
de  chaque  classe  multipliées  par  la  fréquence  de  la  classe, 
somme  qui  est  divisée  par  le  nombre  de  variables  (1). 


(1)  Davenpoiît,  Statistical  mctliods,  p.  lf>. 
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Appliquons  la  règle  à  la  recherche  de  la  moyenne  de  dé- 
viation du  Pimpindla  Saxifraga  L.  d'après  la  médiane; 
celle-ci  tombe  dans  la  classe  11. 


Exemple  5. 


Classes 

Fréquences 

Ecarts 

Produits 

(/') 

(5) 

(/"£) 

5 

i 

6 

.  6 

6 

5 

o 

2o 

7 

9 

4 

36 

8 

22 

3 

66 

9 

38 

2 

76 

10 

62 

1 

62 

14 

61 

0 

0 

12 

29 

1 

29 

13 

14 

2 

28 

14 

4 

3 

12 

15 

4 

4 

16 

249  s  (fi)  356 


283.  Cependant,  pour  arriver  à  un  résultat  d'une  exac- 
titude parfaite,  il  faut  tenir  compte  de  l'influence  exercée 
par  l'intervalle  de  classe.  La  manière  de  procéder  est  alors 
la  suivante  :  on  fait  la  somme  des  produits  des  déviations 
par  les  fréquences;  ensuite  on  calcule  le  nombre  de  fré- 
quences au-dessous  de  la  moyenne  et  le  nombre  de  fré- 
quences restant;  on  soustrait  ces  nombres  l'un  de  l'autre 
et  on  multiplie  le  reste  par  l'intervalle  de  classe;  le  produit 
est  soustrait  de  S  (f.  5)  et  le  reste  est  divisé  par  le  nombre 
de  variables. 

Appliquons  la  règle  aux  données  de  l'exemple  8  du  cha- 
pitre précédent  (Cfr.  n°  230).  Le  nombre  total  de  variables 
est  433,  la  somme  S  (f .  6  )  =  1458  ;  appelons       les  varia- 
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bles  au-dessous  de  la  moyenne  et  V2  les  autres  :  V\  —  V2  = 


-571+887=+316.  L'intervalle  de  classe  = 


Nous  avons  :  316  X  0.182  =  57.512; 

Les  avantages  de  la  moyenne  de  déviation  sont  faciles 
à  discerner.  La  notion  de  l'écart  des  termes  à  la  médiane 
ou  à  la  moyenne  est  des  plus  simples,  même  en  tenant 
compte  de  l'intervalle  de  classe  et  on  ne  doit  faire  appel, 
dans  ce  calcul,  qu'aux  procédés  arithmétique»  élémentaires. 
Dans  le  cas  d'une  série  groupée,  les  opérations  consécu- 
tives se  bornent  à  des  multiplications  et  divisions  rapide- 
ment effectuées.  Le  calcul  n'offre  ainsi  aucune  complica- 
tion, ce  qui  est  toujours  un  précieux  avantage.  La  moyenne 
de  déviation  a  de  nombreuses  applications  aux  questions 
économiques,  principalement  à  celles  qui  concernent  la  dis- 
tribution de  la  richesse  parmi  les  citoyens  d'un  Etat. 


III.  —  La  déviation-type. 

284.  (Standard  déviation).  La  définition  de  la  standard 
déviation  a  été  donnée  en  1894  par  M.  Pearson  dans  son 
premier  mémoire  faisant  partie  de  l'ensemble  intitulé  : 
«  Contributions  to  the  mathematical  theory  of  évolution.  » 
Cette  mesure  est  la  racine  carrée  de  la  moyenne  arithmétique 
des  carrés  des  écarts.  L'expression  standard  déviation  est 
le  terme  sous  lequel  on  désigne  cette  mesure  de  variabilité, 
mais  en  calcul  des  probabilités  elle  porte  le  nom  de  «  er- 
reur moyenne  quadratique  ».  On  l'appelle  aussi  «  erreur 
moyenne  »  ou  «  erreur  moyenne  à  craindre  »  (G-auss),  mais 
pour  éviter  les  confusions  il  est  préférable  de  réserver  le 
nom  d'erreur  moyenne  à  l'erreur  première  représentée  par 
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et  d'appeler  erreur  carrée  ou  quadratique  moyenne  celle  de 
la  forme 


Comme  aussi  on  peut  parler  de  l'erreur  cubique  moyenne 


Ces  diverses  mesures  présentent  entre  elles  des  relations 
très  curieuses  ;  par  exemple,  on  démontre  que 


lorsqu'on  a  un  très  grand  nombre  d'observations,  toutes 
d'égale  précision  (1). 

La  déviation-type  ou  standard  déviation  est  représentée 
par  la  lettre  a  et  sa  formule  est  la  suivante,  donnée  par 
l'équation  : 


Il  est  important  de  rappeler  ici  que,  d'après  la  seconde 
propriété  des  moyennes,  la  somme  des  carrés  des  écarts  à  la 
moyenne  est  un  minimum  (Cfr.  n°  242). 

La  formule,  telle  qu'elle  est  écrite  plus  haut,  est  très 
claire  et  se  rapproche  sensiblement  de  la  formule  de  la 
moyenne  arithmétique  simple. 

I^a  formule  de  la  déviation  type  ou  standard  déviation 
peut  aussi  s'écrire  : 


2 


1/ 


fa  +  fb  + 


+  (n 


+  fn 


ii 


'2 


(28  B)  (-2). 


(1)  Boudin-Mansion,  loc.  cit.,  pp.  174  et  239. 

(2)  Hijjerton  (Palin  W.),  Frequency-curves  and  corrélations.  Londres,. 
Uyton,  1906,  p.  10. 
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fa,  fb,  fn  désignent  les  fréquences  et  a',  b' ,  ri',  l'écart  par 
rapport  de  la  moyenne. 

La  grandeur  de  la  standard  déviation  montre  quel  est 
l'espacement  des  fréquences  autour  de  la  moyenne  :  si  la 
déviation-type  s'exprime  par  une  fraction  proche  de 
l'unité,  c'est  que  la  dispersion  autour  de  la  moyenne  est 
considérable;  au  contraire,  la  fraction  diminue  d'autant 
plus  que  les  fréquences  sont  resserrées  autour  de  la  valeur 
centrale. 

Dans  les  formules  ci-dessus,  on  a  en  vue  le  cas  le  plus 
simple,  celui  où  une  succession  de  nombres,  ayant  tous  un 
poids  égal,  constitue  la  série,  comme  dans  l'exemple  sui- 
vant : 


Exemple  6.  —  Nombre  de  mariages  en  Angleterre  et  dans 
le  Pays  de  Galles  de  1891  à  1900 

(M  =  239,410.5) 


ANNÉES 

Nombre 
de  mariages 

Écarts 
à  la  moyenne 

a;* 

1891  

226,526 

—  12,884.5 

166,010,340.25 

1892  ..... 

227,135 

—  12,275.5 

150,687,900.25 

1893   

218,689 

—  20,721.5 

429,380,562.25 

1894   

226,449 

—  12,961.5 

168,000,4S2.25 

228,204 

—  11,206.5 

125,585,642.25 

1896  .    .  ... 

242,764 

3,353.5 

11,242,609.25 

1897  .    .  ... 

249,145 

9,734.5 

94,750,756.25 

1898  ..... 

255,379 

15,968.5 

254,992,992.25 

1899   

262  334 

22,923.5 

525,486,852.25 

1900   

257,480 

18,069.5 

326,506,830.25 

2,252,644,967.50 

.  /2,252,644,967.50 
V  10 
=  |/   225,264,496  = 
=  45,009 
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285.  D'après  ce  qui  précède  et  en  se  souvenant  de  ce  qui 
a  été  exposé  à  propos  du  procédé  indirect  de  recherche 
de  la  moyenne  (Cfr.  n°  229)  il  n'est  pas  difficile  de  saisir 
-  une  formule  générale  d'une  expression  analogue  à  la  stan- 
dard déviation,  basée  sur  une  valeur  autre  que  M. 

Lorsque  nous  prenons  pour  origine  une  valeur  autre  que 
la  moyenne  arithmétique  et  que  nous  calculons  l'écart  (£) 
de  chaque  terme  (X)  à  cette  valeur  arbitraire  (A),  nous 
avons  (1)  : 

H  =  X  —  A 

et  la  formule  de  l'expression  cherchée  est  analogue  à 
celle  de  la  standard  déviation  (form.  28A)  ;  nous  écrivons 
(s2  étant  le  symbole  de  l'expression  nouvelle)  : 

•s'2  =  ~  S  (29, 

Quant  au  rapport  de  s2  à  a2,  il  est  aisé  à  définir  : 

s2  =  o-2 

plus  l'écart  entre  la  moyenne  véritable  et  la  valeur  arbi- 
traire choisie,  que  nous  appellerons  d  : 

s2  =  a2  +  d-  (30) 

Faisons  application  de  la  règle  à  l'exemple  4  du  cha- 
pitre II.  Il  reste  entendu  que  l'intervalle  de  chaque  classe 

(0  28} 

est  partagé  en  deux  parties  égales         ;  de  sorte  qu'au 

2 

taux  initial  il  suffit  d'ajouter  chaque  fois  0.125.  De  même 
que  dans  l'exemple  7  du  chapitre  II,  au  lieu  de  la  moyenne 
3.807,  prenons  comme  valeur  arbitraire  (A),  origine  des 


(1)  Pour  cette  démonstration  et  ce  qui  suit,  cfr.  l'exposé  détaillé  de  Yule. 
ovrragc  cite,  p.  134  et  suivantes. 


29 


450 


PRINCIPES  DE  STATISTIQUE 


écarts,  le  point  3.625.  Nous  procédons  alors  comme  suit  : 
du  point  d'origine,  ayant  pour  valeur  0  nous  remontons 
vers  les  taux  les  plus  bas  en  attribuant  successivement  à 
chaque  classe  les  valeurs  1,  2,  8,  etc.,  et  nous  procédons  de 
même,  en  sens  inverse,  en  partant  de  l'origine  0,  en  descen- 
dant vers  les  taux  les  plus  élevés.  Nous  faisons  ensuite  le 
produit  de  ces  valeurs  1,  2.  3,  etc.,  par  les  fréquences  in- 
scrites en  regard  des  classes  et  enfin  le  produit  des-  mêmes 
fréquences  par  le  carré  des  écarts  ou,  pour  procéder  d'une 
manière  plus  rapide,  nous  multiplions  encore  une  fois  le 
produit  obtenu  par  les  fréquences,  puis  nous  additionnons 
les  produits.  Nous  rappelant  d'après  l'exemple  8  du  cha- 
pitre II,  que  l'intervalle  de  la  classe  est  0.182,  nous  divisons 
le  dernier  produit  total  de  la  colonne  5  par  le  nombre  total 
des  fréquences,  et  nous  soustrayons  du  quotient  la  valeur 
0.182  au  carré;  enfin,  nous  extrayons  la  racine  carrée  du 
reste  et  nous  tenons  compte  de  la  grandeur  de  l'intervalle 
de  la  classe.  (Voir  tableau  ci-contre.) 
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CLASSES 

Fréquences 

(A) 

Déviation 
p;ir  rapport 
à  A  =  3.625  'E) 

Produits 

(f.  D 

Produits 

(f-  £)2 

Fr. 

1.50  à  1 

.74 

17 

— 

8 

'  130 

1088 

J .75  à  1 

.90 

3 

— 

7 

21 

147 

2.00  à  2 

.21 

10 

— 

6 

60 

360 

2.25  à  2 

49 

8 

— 

5 

40 

200 

2  50  à  2 

.74 

34 

— 

4 

136 

544 

2.75  à  2 

99 

28 

— 

3 

84 

252 

3.00  à  3 

24 

34 

— 

2 

68 

136 

3.25  à  3 

49 

26 

— 

1 

26 

26 

3.50  à  3 

74 

47 

0 

-  571 

_ 

3.75  à  3 

99 

44 

+ 

1 

44 

44 

4.00  à  4 

24 

60 

+ 

2 

120 

240 

4.25  à  4 

49 

24 

+ 

3 

72 

216 

4.50  à  4 

74 

27 

+ 

4 

108 

432 

4.75  à  4 

99 

9 

+ 

5 

j:  45 

225 

5.00  à  5 

24 

22 

i 

T 

« 
o 

132 

792 

5  25  à  5 

49 

8 

+ 

7 

56 

392 

5.50  a  5 

74 

5 

+ 

8 

40 

320 

5.75  à  5 

99 

13 

+ 

9 

117 

1053 

6.00  à  6 

24 

8 

+ 

10 

80 

SOO 

6.25  à  6 

49 

2 

+ 

11 

22 

242 

6.50  à  6.74 

1 

+ 

12 

12 

144 

6.75  à  6. 

99 

o 

O 

+ 

13 

39 

507 

433 

-f  887 

8160 

(0.182)2  =  0.033 
a2  =  [/ 18  81-2 
a  =  4  337 
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286.  Une  règle  de  calcul  un  peu  différente  peut  être  for- 
mulée en  ces  termes  (1)  :  adopter  pour  moyenne  une  cer- 
taine valeur  arbitraire  proche  de  la  moyenne  véritable  : 
établir  les  écarts  de  chaque  terme  à  cette  valeur  :  en  faire 
le  carré,  faire  la  somme  des  carrés  :  soustraire  n  fois  le 
carré  de  la  différence  entre  le  nombre  assumé  et  la 
moyenne  vraie  :  diviser  par  n  :  extraire  la  racine  carrée 
du  quotient. 

La  formule  exprimant  cette  méthode  est  la  suivante  : 


Reprenons  l'exemple  précédent  et  traitons-le  d'après  la 
règle  qui  vient  d'être  énoncée. 
Nous  savons,  en  premier  lieu,  que  M  —  3.807. 
La  valeur  arbitraire  assumée  est  A  =  3.625. 


résultat  identique  à  celui  obtenu  précédemment. 

Nous  avons  vu  (Cfr.  n°  250)  qu'on  démontre  facilement 
que  la  moyenne  d'une  série  entière  est  égale  à  la  somme 
des  moyennes  particulières,  divisée  par  le  nombre  de  ces 
moyennes,  formées  à  l'aide  des  termes  de  la  série,  si  ces 
termes  ont  un  poids  égal.  M.  Yule  démontre  la  même  pro- 
priété en  ce  qui  concerne  la  standard-déviation  (2).  Appe- 


M  —  A  =  —  0.182 
(M  -  A)2  =  0,03312 
n  (M  —  Aj2  =  —  14.340 
Le  produit  S  (/'£)*  =  8160 


1/ 


8100  -  1 4.310 
433 


433 


=  1/18.806  =  4.337 


(1)  D'après  King  (W.  I.),  Eléments  of  statistical  method,  New-York,  1912, 
p.  149. 

Cfr.  An  Introduction  to  the  theory  of  statistics,  p.  142. 
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loris  M  la  moyenne  d'une  série  entière,  Mj  et  M2  les 
moyennes  de  parties  composant  cette  série,  di  et  d2  la  dif- 
férence, nous  avons  évidemment 

Mi  —  M  =  di 
M2  —  M  =  d2 

et  les  standard  déviations  à  partir  de  M  sont,  en  raison  de 
ce  qui  a  été  dit  plus  haut, 

oV  +  <ii* 

Donc 

N.   S*  =  Nl  (ffit  +  dl«)   +  N2  (0-22  +  ^2) 

et  par  conséquent,  en  admettant  que  les  termes  des  deux  sé- 
ries particulières  soient  en  nombre  égal       +  N2  =  -j^j 


0-2  _  (oV  +  Q-22) 


287.  Ainsi  que  nous  l'avons  déjà  fait  observer  (Cfr. 
n°  280,  note)  il  existe  entre  la  moyenne  de  déviation  et  la 
déviation-type  un  rapport  constant  qui  peut  se  traduire 
par  environ  0.80  (0.79735  (1),  cette  mesure  marquant  le 
rapport  de  la  mean-déviation  à  la  standard-déviation.  Cette 
mesure  n'est  qu'approximative,  mais  comme  le  fait  remar- 
quer M.  Yule,  elle  présente  au  moins  l'avantage  de  vérifier 
l'exactitude  du  calcul  arithmétique  et  d'empêcher  les  er- 
reurs les  plus  grossières.  Ainsi,  par  exemple,  nous  voyons 
que  pour  les  nombres  19,  25,  28,  32,  33  et  40,  A  =  5;  la  dé- 
viation type  pour  les  mêmes  données  est  : 

^  xn      272  ✓  

=^  =    '    -  1/38.857  =  6.233 
n  7 


or  : 

5.000 


f,  233 


=  0.802 


(1)  Davenpokt,  Statistical  methods,  p.  16. 
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Une  des  deux  mesures  étant  connue,  on  obtient  l'autre 
par  une  simple  opération  arithmétique.  Son  rôle  essentiel 
consiste  à  faciliter  la  vérification  de  calculs  souvent  assez 
laborieux. 

Il  ne  faut  pas  perdre  de  vue  cependant  que  la  constante 
ne  donne  qu'une  valeur  jjar  approximation  et  ne  dispense 
pas  du  calcul  direct  si  l'on  veut  arriver  à  une  grande  pré- 
cision. Ainsi,  la  moyenne  de  déviation  des  salaires  des  ou- 
vriers (adultes  mâles)  employés  dans  les  ateliers  de  robi- 
netterie en  Belgique  (octobre  1903)  est  3.234  comme  nous 
l'avons  vu  au  n°  282;  la  déviation  type  des  salaires  des 
mêmes  ouvriers  est  4.337  (Cfr.  n°  284).  Le  rapport  entre 

ces  deux  nombres  n'est  que  t'-~  =  0.7 45,  inférieur  donc  à 

4,337 

la  relation-type  donnée  plus  haut. 

La  déviation-type  (standard-déviation)  est  la  meilleure 
mesure  de  la  variabilité  d'une  série.  Géométriquement,  on 
peut  la  définir  comme  le  demi-paramètre  de  la  courbe, 
c'est-à-dire  l'abscisse  du  point  où  la  courbe  de  fréquence 
change  de  courbure  (1). 

La  précision  des  résultats  se  calcule  aisément  à  l'aide  de 
la  standard-déviation.  On  trouve,  dit  Mansion  (2),  que 
la  somme  des  carrés  des  différences  entre  un  certain 
nombre  de  valeurs  xx,  x2,...  x\x  et  leur  moyenne  arithmé- 
tique X,  est  telle  que  l 'on  a  : 

On  peut  donc  estimer  la  précision  de  la  moyenne  X  des  n 
grandeurs  mesurées  Xi,  x2,,..  x^  par  l'inverse  (ou  la  réci- 
proque) de  la  racine  carrée  de  la  moyenne  des  carrés» 
des  résidus 

£  (X  —  x)2 


(1)  Davenpokt,  Statistical  methods,  p.  16. 

(2)  Boudin-Mansion,  Leçons  sur  le  calcul  des  probabilités,  p.  279  (3). 
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La  précision  de  la  moyenne  est  donc  donnée  (1)  par  la 
formule 

4  (31) 

M.  Mansion  (2)  pense  qu'on  peut  encore  mieux  exprimer 
cette  précision  par  la  formule 

1 


SIX  -  x  I  (32) 
M 

des  valeurs  absolues  des  différences  X  —  x  parce  que  les 
valeurs  les  plus  éloignées  de  la  moyenne,  qui  sont  les  plus 
suspectes,  y  ont  moins  d'influence.  Nous  ferons  observer 

cependant  que  la  formule  -  est  adoptée  généralement  en 
statistique  pour  exprimer  la  précision  de  la  moyenne. 


IV.  —  Déviation  interquartile. 

288.  Nous  savons  qu'on  donne  le  nom  de  médiane  à  la 
valeur  centrale  de  la  série  statistique.  Partant  de  là,  nous 
sommes  amenés  à  une  notion  nouvelle  :  celle  d'une  valeur 
qui,  de  concert  avec  la  médiane,  partagerait  la  série  en 
quatre  parties.  Admettons  que  l'on  puisse  déterminer  une 
valeur  telle  que  tous  les  termes  de  la  série  qui  la  précèdent 
ne  représentent  pas  plus  du  quart  du  nombre  total,  et  une 
seconde  valeur  telle  que  les  observations  qui  la  suivent 
valent  un  quart  de  la  somme;  alors  nous  avons  le  premier 
et  le  troisième  quartile.  On  les  désigne  par  les  lettres  Qi  et 
Q3.  Le  second  quartile  se  confond  évidemment  avec  la  mé- 
diane. Les  quartiles  et  la  médiane  sont  des  mesures  de 
position  qui  ont  l'avantage  d'être  simples  et  faciles  à  dé- 


(1)  U.  Yule,  loe.  cit.,  p.  253. 

(2)  Mansion,  loc.  cit.,  p.  280,  note  (*). 
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terminer.  L'intervalle  compris  entre  les  deux  quartiles 
et  Q3  est  exactement  égal  à  celui  qui  précède  Qx  plus  celui 
qui  suit  Q3.  Dans  chacun  des  quatre  groupes  constitués  par- 
ées mesures,  on  relève  un  nombre  égal  de  fréquences  et  l'on 
peut  poser  : 

Mé  —      =  Q3  —  Mé 

dans  le  cas  d'une  distribution  rigoureusement  symétrique. 
Mais  au  lieu  de  cette  mesure  de  dispersion  dont  les  condi- 
tions ne  se  trouvent  que  rarement  réalisées,  on  admet  en 
pratique  la  substitution  de  l'expression  suivante  : 

Qi  -  Q3  (33) 
S 

Pour  déterminer  Qx,  Q3  et  Mé,  on  se  sert  des  formules 
suivantes  : 

n  +  1 

Me  =  — ^ —  termes  (34) 

Qi  =  — i —  termes  ,  (35) 

Q3  =   4  -termes  (36) 

A  l'aide  de  la  même  formule,  on  peut  fixer,  comme  nous 
le  verrons  plus  loin,  la  valeur  des  déciles  (dixièmes  de  la 
grandeur  totale)  et  les  percentiles  (centièmes  de  la  série 
observée). 

La  médiane  et  les  quartiles  sont  particulièrement  faciles 
à  trouver  dans  les  séries  composées  de  variables  classées 
d'après  leur  grandeur,  chaque  grandeur  étant  répétée 
autant  de  fois  qu'il  y  a  d'objets  la  représentant.  L'exemple 
des  94  amandes  que  nous  avons  donné  en  parlant  de  la  mé- 
diane comme  moyen  de  représentation  synthétique  peut 
servir  d'illustration.  Le  lecteur  voudra  bien  se  reporter 
au  tableau  dans  lequel  les  94  amandes  sont  classées  d'après 
leur  longueur  (Cfr.  n°  259,  ex.  18).  D'après  la  formule  qui 
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précède,  nous  savons  que  la  médiane  est  placée  ainsi  : 

-  ou  ^     ^  —  47,5,  c'est-à-dire  qu'elle  se  trouve  entre 
2  2 

le  47°  et  le  48e  terme;  consultant  le  tableau,  nous  voyons 
que  les  longueurs  de  la  47e  et  de  la  48°  amandes  sont  iden- 
tiques (3  c.  25)  et  que  la  médiane  est  donc  3  c.  25.  Le  pre- 
N  4-  1 

mier  quartile  est  :  — -j —  =  23,7;  en  nous  reportant  au 

tableau,  nous  constatons  que  les  longueurs  indiquées  au 
n°  23  et  au  n°  24  diffèrent,  étant  respectivement  3  c.  00  et 
3  c.  02,  nous  prenons  la  moyenne  de  ces  deux  termes  et 
nous  écrivons  :  Qi  =  3,01.  Enfin,  le  troisième  quartile  est 

-  -p- — ■  —   71,1.  c'est-à-dire  une  valeur  intermédiaire 

4 

entre  celles  inscrites  sous  les  nos  71  et  72  ;  cette  valeur  étant 
la  même  pour  les  deux  variables,  nous  écrivons  :  Qs  =  3,52. 

La  mesure  de  la  dispersion  interquartile  est  par  consé- 
quent : 

Si  ~  Q'      3M  ~  ^  _  0,285 

289.  La  déviation  interquartile  est  particulièrement  utile 
pour  caractériser  deux  séries  que  l'on  désire  comparer,  par 
exemple  le  relevé  des  salaires  à  deux  époques  différentes. 
Bosco,  qui  a  calculé  la  déviation  interquartile  des  salaires 
des  ouvriers  mineurs  belges  en  1896  et  en  1900  (ouvriers 
adultes  travaillant  au  fond)  d'après  l'enquête  de  l'Office 
du  travail  de  Belgique  (1),  a  déterminé  les  résultats  sui- 
vants (2)  : 

Exemple  8. 

1896  1900 

Quartile  inférieur    ....    .  f r.    3.11  4.27 

Médiane   3.58  5.07 

Quartile  supérieur  4.19  6.40 


(1)  Office  du  Travail  de  Belgique,  Statistique  des  salaires  dam  les  mines: 
de  houille,  octobre  1896,  mai  1900.  Bruxelles,  1901,  p.  34. 

(2)  Bosco  (A.),  Lezioni  di  statistica,  p.  508. 
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Vérifions  les  calculs  du  statisticien  italien  en  ce  qui  con- 
cerne :  1°  la  médiane  de  1896  ;  2*  le  quartile  supérieur  pour 
la  même  année. 

En  1896,  travaillaient  au  fond  :  61,299  ouvriers.  (Cfr. 

n°  207.) 

n  4-  1       61  299  4-  1 
Mé=      ±      =  01  '    ^  =  30,650 

Jusqu'à  la  classe  3  fr.  à  fr.  3.49,  dont  la  moitié  est  fr.  3.25, 
il  y  a  155,  861 ,  2,860 ,  7,660 16,456  ouvriers  =  27,992.  La 
médiane  est  donc  comprise  dans  la  classe  suivante  :  fr.  3.50 
à  fr.  3.99.  Mais  comme  cette  classe  est  trop  nombreuse 
(13,444  ouvriers),  il  y  a  lieu  de  procéder  à  une  interpolation 
simple,  du  genre  de  celle  que  nous  avons  déjà  calculée 
précédemment.  D'après  cela,  on  a  : 

Mé  -  3.49  +  .2;6!f..  Va  =  3,49  4-  0,09  =  3,58 
11,444  4 

résultat  qui  concorde  avec  celui  obtenu  par  Bosco. 

Q,  «  3  <"  t  "  -  i  =  45974,8 

4  4 

En  ajoutant  à  la  classe  3  fr.  à  fr.  3.49  la  classe  entière  qui 
la  suit  immédiatement,  on  arrive  au  chiffre  de  41,436, 
proche  du  troisième  quartile.  La  classe  suivante  (4  francs  à 
fr.  4.49)  est  celle  qui  contient  le  quartile,  mais  comme  elle  est 
trop  nombreuse,  il  y  a  lieu  de  procéder  comme  ci-dessus.  On 
a  donc  : 

3,99  4-  î^  .  V2  =  3,99  +  0,20  =  4,19 

ainsi  que  Bosco  l'a  calculé. 

Qx  calculé  d'après  la  même  méthode  donne  fr.  3.11. 

La  dispersion  interquartile  des  salaires  recueillis  en 
1896,  est  de  : 

3.11  —  4.19 
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La  même  mesure  pour  1900  est  : 

290.  A  titre  de  vérification  on  peut  utilement  se  rappe- 
ler que  la  mesure  de  la  dispersion  interquartile  représente 
environ  les  deux  tiers  de  la  déviation-type,  l'exactitude  de 
ce  rapport  n'existant  d'ailleurs  que  dans  les  cas  où  la 
courbe  se  rapproche  sensiblement  de  la  courbe  normale. 
Ainsi,  dans  le  cas  de  la  distribution  des  salaires  parmi  une 
population  ouvrière,  on  n'obtiendrait  pas  une  vérification 
complète  du  rapport  dont  il  s'agit,  mais  seulement  une 
approximation.  La  dispersion  interquartile  des  salaires 
des  ouvriers  mineurs  (fond)  en  Belgique  en  1896  a  pour 
mesure  0.54,  pour  la  même  série,  o  a  pour  valeur  0.86. 

Le  rapport 

Q       0.S4      .    '  • 
T  =  (T86  =  °'63  p-  c> 


ne  répond  pas  tout  à  fait  à  la  proportion  des  deux  tiers, 
parce  que  la  courbe  des  salaires  n'affecte  pas  la  forme  de 
la  courbe  normale.  Malgré  ces  conditions  défectueuses, 
la  règle  empirique  ci-dessus,  en  ne  la  prenant  que 
comme  une  large  approximation,  peut  être  regardée 
comme  un  guide  de  l'esprit  et  une  vérification  sommaire 
du  travail  arithmétique. 

La  grande  simplicité  des  opérations  arithmétiques  né- 
cessaires au  calcul  assure  à  la  mesure  de  dispersion  inter- 
quartile une  faveur  qu'il  serait  difficile  de  lui  disputer. 
Cependant,  il  ne  faut  pas  s'illusionner  sur  la  valeur  du 
procédé.  Il  ne  prend  sa  signification  entière  que  si  la 
courbe  de  la  série  est  à  peu  près  symétrique  ou  normale.  La 
dispersion  interquartile  se  base  sur  le  fait  que,  la  déviation 
entre  les  quartiles  étant  mesurée,  il  y  lieu  de  penser  que 
cette  valeur  représente  la  série  entière;  c'est  donc  comme 
s'il  n'y  avait  pas  de  modification  sensible  à  la  courbe  en 
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dehors  des  quartiles.  Le  postulat  est  exact  pour  les  courbes 
normales,  mais  il  est  faux  pour  les  autres.  Après  le  troi- 
sième quartile,  il  y  a  encore  place  pour  de  nombreuses  alté- 
rations. Dans  les  statistiques  de  salaires,  notamment,  on 
remarque  aux  époques  de  hausse  une  poussée  qui  étend 
vers  la  droite,  bien  loin  au  delà  du  point  normal,  la  courbe 
de  distribution  des  salaires. 

V.  —  Coefficient  de  variation. 

291.  On  désigne  sous  ce  nom  une  mesure  relative  de  la 
dispersion.  Celle-ci  est  donc  comparée  à  un  élément  fixe 
servant  de  point  de  comparaison.  La  quantité  obtenue  à 
l'aide  de  ce  calcul  est  purement  abstraite  :  elle  n'a  pas  de 
rapport  avec  l'unité  initiale  ayant  servi  à  la  statistique; 
ce  point  est  à  retenir  pour  l'interprétation  des  résultats. 

Chacune  des  mesures  que  nous  avons  étudiées  sous  les 
numéros  précédents  a  son  coefficient  de  variation  rela- 
tive. On  le  calcule  sur  la  moyenne  arithmétique  quand  il 
s 'agit  de  la  déviation-type  de  valeurs  non  groupées  ;  on  se 
sert  de  la  valeur  arbitraire  admise  pour  la  moyenne  dans 
le  cas  de  phénomènes  se  présentant  par  classes  et  par  fré- 
quences. Le  coefficient  de  variation  interquartile  se  cal- 
cule d'après  la  médiane  et  il  en  est  de  même  du  coefficient 
de  la  moyenne  de  déviation. 

La  formule  du  coefficient  de  variation  a  été  donnée  par 
M.  Pearson  sous  cette  forme  en  ce  qui  concerne  la  déviation- 
type  : 

V  =  10°-  £  (37) 

dans  cette  équation,  a  est  la  standard-déviation  et  M  est  la 
moyenne  arithmétique. 

Pour  calculer  le  coefficient  de  variation  de  la  moyenne 
de  déviation,  on  se  sert  de  la  formule  : 
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dans  laquelle  A  est  le  quotient  de  la  division  du  produit  des 
variables-  par  les  écarts  et  Mé  signifie  la  médiane. 

Le  coefficient  de  variation  interquartile,  s'exprime  par 
la  formule  ci-après  : 

Q3  -  Ui 


U3  +  0. 

dans  laquelle  Q?,  est  le  quartile  obtenu  par  la  formule 


(39) 


3(n  +  1) 

 4   (36^ 


«t  Qi  vient  de  la  formule 

H  +  1 


(35) 


292.  Ces  différentes  formules  étant  très  simples,  il  suf- 
fira d'en  faire  de  rapides  applications  : 

Moyenne  de  déviation  (coefficient  de  la) 

Exemple  9. 

Nombres  19,  25,  26,  28,  32,  33,  40.  Mé      28.  A  =  5. 

■    Ê  j§  - 0-"83 

Exemple  10. 

Pimpinella  saxifraga  L.  Mé  =  10.305.  A  =  1.429 
A  1.429 

Dispersion  interquartile  (coefficient  de  la) 

Exemple  11. 

Salaires  des  ouvriers  mineurs  belges  (adultes  travaillant 
au  fond),  en  1896  : 

Qa  -  Qj  _  4.19  -  3.11 

Qz  +  Qi      4,19  +  3,11  U'14/ 
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Déviation-type  (coefficient  de  la) 


Exemple  12. 


Salaires  des  ouvriers  robinettiers,  en  1903  : 


V  =  100.  Z  =  100. 


4.337 
3,f>:20 


=  1,198 


VI.  —  Dissymétrie  (Skewness). 


293.  Skewness  est  le  nom,  —  dont  l'équivalent  en  fran- 
çais pourrait  se  rendre  à  peu  près  par  le  terme  «  dissymé- 
trie »,  —  donné  par  le  professeur  Pearson  à  ce  fait  que  la 
dispersion  des  variables  à  partir  de  la  normale  n'est  pas 
régulière.  Dans  la  courbe  normale  on  relève  que  ses  points 
sont  symétriques,  c'est-à-dire  qu'à  une  égale  distance  de  la 
moyenne  ils  sont  équivalents.  Mais  le  plus  grand  nom- 
'bre  de  courbes  appartiennent  à  un  type  asymétrique 
dérivé  de  la  courbe  normale.  Il  est  donc  exception- 
nel, dans  les  courbes  statistiques,  que  la  moyenne,  la  mé- 
diane et  le  mode  se  placent  au  même  point  et  c'est  sur 
l'éloignement  plus  ou  moins  grand  de  ces  mesures-  l'une 
par  rapport  à  l'autre  que  se  trouve  basée  la  mesure  de  dis- 
symétrie ou  Skewness  de  la  courbe. 

Il  existe  plusieurs  procédés  pour  mesurer  la  dissymétrie 
de  la  courbe. 

La  mesure  la  plus  simple  consiste  à  faire  la  différence 
entre  le  mode  et  la  moyenne  arithmétique. 

Soient  M  la  moyenne  arithmétique,  Mo  le  mode, 
la  formule  : 


donnera  une  première  mesure  de  dissymétrie  de  la  courbe. 
Cette  mesure,  de  même  que  pour  la  dispersion,  a  un  coeffi- 
cient que  l'on  obtient  en  divisant  la  différence  entre  la 


Dissymétrie  =  M  —  Mo 


(40) 
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moyenne  et  le  mode  par  la  moyenne  de  déviation  calculée 
d'après  le  mode,  ainsi  que  l'indique  la  formule  : 
Coefficient  de  dissymétrie  = 

M  —  Mo 

—   (41) 

A  Mo 

mais,  à  cause  de  la  difficulté  de  déterminer  le  mode  d'une 
façon  absolument  sûre,  on  substitue  souvent  la  médiane  au 
mode.  Les  formules  de  dissymétrie  et  du  coefficient  de  dis- 
symétrie restent  les  mêmes,  sauf  à  remplacer  la  lettre  Mo 
par  Mé. 

On  mesure  également  la  dissymétrie  de  la  distribution 
des  variables  autour  de  la  médiane  au  moyen  de  l'expres- 
sion simple  : 

Qs  +  tii  -  2  Mé.  (42) 

et  on  la  transforme  en  un  coefficient  de  dissymétrie  en  la 
comparant  à  la  déviation  interquartile  au  moyen  de  la  for- 
mule : 

q3  +  Ql  _  g  Mé 

Q3  -  Qi  !43> 
2 

Sans  être  absolument  parfaite,  cette  expression  de  l'asymé- 
trie de  la  distribution  possède  le  mérite  d'être  claire  et 
facile  à  calculer.  Son  exactitude  est  suffisante  pour  qu'on 
l'emploie  dans  tous  les  cas  où  il  n'est  pas  nécessaire  de 
tenir  compte  des  dernières  variables. 

Mais  la  mesure  la  plus  généralement  adoptée  est  celle  qui 
rapporte  à  la  déviation-type  la  différence  entre  la  moyenne 
et  le  mode,  ainsi  que  le  professeur  Pearson  a  proposé  de  le 
faire  : 

^LzzJIo  (44) 


M.  Yule  fait  observer  que  la  position  du  mode  étant  diffi- 
cile à  indiquer  avec  précision,  on  peut  adopter  une  formule 
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approximative  basée  sur  la  médiane  et  la  moyenne.  Cette 
formule  est  la  suivante  : 

3        ~  Mé>  (45) 

Enfin,  on  a  proposé  un  coefficient  de  la  dissymétrie  basée 
sur  la  mise  au  cube  des  écarts  à  la  moyenne,  au  moyen  de  la 
formule  : 


V        n  (46) 


294.  Bien  que  les  formules  précédentes  ne  présentent  en 
elles-mêmes  aucune  difficulté,  il  ne  sera  pas  inutile  de  cal- 
culer à  l 'usage  du  lecteur  les  résultats  de  leur  application  à 
des  données  connues. 

Les  courbes  des  salaires  des  ouvriers  mineurs  en  Bel- 
gique en  1896  et  en  1900  que  nous  avons  utilisées  déjà  à 
plusieurs  reprises  fournissent  un  matériel  excellent  pour 
déterminer  la  dis  symétrie  relative  de  la  distribution  des 
variables. 

Voyons  d'abord  les  résultats  donnés  par  la  formule  des 
quartiles  :  d'après  la  statistique  des  salaires  en  1896,  Q3  = 
fr.  4.19,  Q!  =  fr.  3.11,  Mé  =  fr.  3.58.  Nous  avons  donc,  en 
remplaçant  la  notation  de  la  formule  par  les  données  nu- 
mériques équivalentes, 

Exemple  13. 
4  fr.  19  +  3fr.  11  —  2  X  (3  fr.  58)  0,14 


4  fr.  19  —  3  fr.  11  0,54 
2 


=  0.2592  (43) 


Etant  donné  qu'en  1900,  Q3  =  fr.  6.40,  Qx  =  fr.  4.27, 
Mé  =  fr.  5.07,  la  même  formule  donne  les  résultats  sui- 
vants : 

Exemple  14. 

6fr.40  +  4tr.27  — 2x(5fr.Q7)  _  0,53  _  . 

6  fr.  40      4  fr."27       ~  _  ÎTÔ65      U'4y  'b     [" ' 
2 
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D'après  la  formule  46  on  doit  établir  la  relation  entre  la 
différence  du  mode  à  la  moyenne  par  rapport  à  la  dévia- 
tion-type. 

Dans  les  statistiques  de  salaires,  le  mode  étant  souvent 
difficile  à  préciser,  nous  recourrons  à  la  formule  approxi- 
mative donnée  par  M.  Yule  pour  substituer  la  médiane  au 
mode.  En  1896,  la  moyenne  arithmétique  des  salaires-  est 
fr.  3.67  et  a  =  0.86  ;  en  1900,  la  moyenne  arithmétique  est 
fr.  5.36  et  o  =  1.49. 

Ceci  étant  donné,  on  a,  comme  seconde  mesure  de  dissy- 
métrie des  courbes  : 

Exemple  15. 

8x(Sfr.67-»fr.W)_0.«_ 
U,ot>  U,ob 

Exemple  16. 

(1900)  3x(5fr.86-5fr.  07)_  0|_  _  Q  ^  ^ 


VII.  —  Variabilité. 


295.  Les  mesures  de  dispersion  dont  nous  avons  fait 
l'exposé  sont  toutes  basées  sur  la  moyenne  et  sur  l'écart 
de  chaque  terme  à  la  moyenne,  cet  écart  étant  considéré 
comme  une  erreur  dont  la  mesure  la  plus  exacte  est  donnée 
par  la  standard-déviation  (o"). 

Ceci  nous  met  sur  la  voie  de  considérations  desquelles 
découle  l'utilité  d'une  formule  nouvelle,  celle  de  la  varia- 
bilité. 

Les  phénomènes  considérés  sous  le  rapport  de  leur  dis- 
persion présentent  entre  eux  des  différences  essentielles. 
Comme  le  dit  le  professeur  Gini  (1),  il  existe  des  carac- 


(1)  Prof.  Corrado  Gini  :  «  Variahilita  e  mvtabilita.  Bologna,  Cuppini, 
J912,  p.  17. 
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tères  qui,  en  réalité,  conservent,  au  cours  des  observations, 
la  même  intensité,  mais  qui  se  présentent  à  nous  sous  diffé- 
rentes modalités  quantitatives  uniquement  à  cause  des  er- 
reurs, accidentelles  ou  systématiques,  commises  par  l'ob- 
servateur. En  lui-même  le  fait  observé  ne  change  pas,  mais 
la  mesure  de  sa  grandeur,  de  son  intensité,  n  'apparaît  pas 
invariable.  Le  cas  le  plus  frappant  qu'on  puisse  citer  est 
celui  des  observations  astronomiques   :  encore  qu'elles 
soient  faites  par  des  savants,  à  l'aide  d'instruments  d'une 
grande  précision,  elles  ne  sont  pas  rigoureusement  iden- 
tiques. Il  en  est  des  exemples  mémorables.  Sans  doute  le 
phénomène  observé  reste  invariable,  mais  la  faiblesse  de 
nos  sens,  l'imperfection  des  instruments  que  nous  em- 
ployons, certaines  circonstances  accidentelles  ne  nous 
laissent  pas  arriver  à  la  perfection,  au  point  qu'aucune 
de  nos  observations  ne  s 'écartant  de  la  vérité  absolue 
elles   seraient   toutes   rigoureusement   semblables.  Dès 
lors,  nous  n'avons  qu'un  parti  à  prendre  :  choisir,  entre 
ces  mesures,  celle  qui  est  la  plus  proche  de  la  vérité,  —  la 
moyenne  — ,  puis  calculer  l'écart  de  la  série  par  rapport  à 
la  moyenne.  C'est  ce  que  l'on  a  fait  par  le  calcul  de  la 
moyenne  de  déviation,  de  la  déviation-type  ou  standard- 
déviation,  de  la  déviation  interquartile,  etc. 

296.  Mais  à  côté  de  ces  phénomènes,  il  en  existe  d'autres 
bien  plus  nombreux  qui  font  l'objet  des  recherches  usuelles 
de  la  statistique  :  ce  sont  les  faits  de  la  vie  physique,  sociale 
et  économique.  Ils  ne  semblent  aucunement  se  modeler  sur 
un  type  ;  et  si  nos  observations  nous  les  montrent  dans  un 
état  de  perpétuelle  évolution,  ce  n'est  pas,  comme  dans  le 
cas  précédent,  parce  qu'elles  sont  impuissantes  à  les  saisir 
avec  une  précision  suffisante.  Aussi  la  question  n'est-elle 
plus-  :  ((  de  combien  la  quantité  x  s'éloigne-t-elle  de  la 
moyenne?  »,  mais  bien  celle-ci,  très  différente  :  «  de  com- 
bien diffèrent  entre  elles  les  quantités  relevées  effective- 
ment? »  Les  prix  variables  d'une  denrée  ne  peuvent  être 
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assimilés  aux  erreurs  commises  par  un  astronome  dans 
l'évaluation  de  l'ascension  droite  d'un  astre.  Les  prix  sont 
déterminés  par  un  ensemble  de  facteurs,  chaque  prix  a  sa 
raison  d'être,  son  individualité;  nous  tenons  à  savoir  si  les 
prix  ont  beaucoup  varié  ou  non.  C'est  un  problème  tout 
autre  que  celui  qui  consiste  à  savoir  quelle  est,  entre  diffé- 
rentes mesures,  la  plus  exacte,  la  plus  probable. 

A  des  problèmes  différents,  il  est  rationnel  d'appliquer 
des  méthodes  différentes.  C'est  la  raison  qui  a  con- 
duit le  professeur  Corr.  Grini  (1912)  à  rechercher  une  me- 
sure de  dispersion  autre  que  celles  basées  sur  la  moyenne  : 
cette  mesure  est  le  coefficient  de  variabilité  entre  n  ca- 
ractères. La  question  est  la  suivante  :  ((  de  combien  les  di- 
verses grandeurs  effectives  diffèrent-elles  entre  elles?  » 
et  non  «  de  combien  les  diverses  quantités  relevées  s'éloi- 
gnent-elles  de  leur  moyenne  arithmétique?  »  L'indice  de 
variabilité  mesure  donc  l'intensité  de  la  différence  entre 
les  grandeurs  effectives. 

297,  Adoptons  la  notation  ci-après:  alf  a-,  ...«„  désignent 
les  n  quantités  rangées  suivant  un  ordre  croissant;  at  est 
une  quantité  quelconque  de  rang  i. 

Entre  deux  quantités  consécutives  de  la  série,  il  y  a  un 
intervalle  d'un  grade. 

La  distance  graduelle  ch,  t  qui  sépare  deux  termes  at  et  a 
est  égale  au  nombre  de  grades  qu'il  y  a  entre  eux.  Les 
quantités  at  et  at  sont  symétriques  quand  i  +  t  =  n  -\-  1  ou 
t  =  n  —  i  -\-  1  et  l 'on  a  di<n-  i  +  \  =  n  +  1  —  2i. 

Il  y  a  n  (n  —  1)  différences  possibles  entre  les  n  quanti- 
tés de  la  série  graduée  prises  deux  à  deux  et  la  moyenne 
arithmétique  de  ces  n  (n  —  1)  différences  est  donnée  par  la 
formule  : 

n+  ] 

*  =  ^T)  t  j ,  («  +  i  -  2i)  (aB (47) 
La  somme  des  n  (n  —  1)  différences  entre  chaque  quan- 
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tité  et  toutes  les  autres  est  évidemment  égale  à  la  somme 
des  n2  différences  entre  chaque  quantité  et  toutes  les  quan- 
tités, de  telle  sorte  que  la  différence  moyenne  avec  répéti- 
tion entre  les  n  quantités  sera 


n  +  l 

2  ~r 

R         W    i  =  1  ~  * 

et 

n  —  \  ' 
A   =  —  A  (48) 

r  n 

Ces  deux  différences  ont  chacune  leur  utilité  particulière. 
Puisque  n  -f-  1  —  %i  =  diyn-i+i,  on  peut  écrire  A  sous  la 
forme  suivante  : 

n  +  1 

A  =  M^)iLdi''\-i  +  l[an-i+l~ai) 


ou  encore 

1 

n{n  —  \)  ,  =  ! 


en  désignant  par 
deux  quantités  géométriques  (1). 


ai      an  -  i  +  1 


la  différence  absolue  entre 


298.  Le  procédé  de  calcul  arithmétique  nous  intéresse 
spécialement.  On  peut  le  décrire  comme  suit  : 

Etant  donné  un  tableau  statistique  rangeant  les  varia- 
bles dans  un  certain  ordre,  —  que  ce  soit  l'ordre  chronolo- 
gique comme  dans  certaines  statistiques  démographiques, 
ou  l'ordre  des  grandeurs  comme  dans  de  nombreuses  sta- 
tistiques sociales  et  économiques,  —  on  commence  par  di- 
viser la  série  en  deux  parties  égales  et  l'on  dresse  un  ta- 
bleau dont  la  première  colonne  est  réservée  à  la  moitié  des 

variables  dans  l'ordre  croissant  (de  ai  à  an)  ;  les  autres 

I 

sont  insérées  dans  la  seconde  colonne  et  classées  dans  l'or- 
dre décroissant  (de  a  n  h  an+j  ).  Les  termes  placés  en  re- 


(1)  Cfr.  Prof.  Corr.  Gini,  loc.  cit.,  pp.  21-23. 
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gard  l'un  de  l'autre  sont  symétriques  :  on  en  calcule  la  dif- 
férence pour  chaque  couple  an_i  +  ] — a\  La  distance  gra- 
duelle entre  variables  symétriques  est  égale  à  n  +  i  —  2i, 
soit  dans  l'exemple  proposé  38  +  1  —  2  =  37,  pour  i  =  1; 
la  quatrième  colonne  est  réservée  à  l'inscription  des  dis- 
tances graduelles  en  ordre  décroissant.  La  cinquième  sert 
à  indiquer  les  produits  des  différences  entre  variables  sy- 
métriques par  les  distances  graduelles  (an ,  _  t  +  }  —  «,)  X 

(n  +  1  —  2i)  j.  Nous  faisons  la  somme  de  ces  produits  et 

•  i-  2 

nous  multiplions  cette  somme  par   pour  obtenir 

1  1      n  {n  —  1)  1 

2 

la  différence  moyenne  simple  et  par  — ~  — ,  si  l'on  veut  con- 
naître la  différence  moyenne  avec  répétition. 

299.  Nous  faisons  application  de  ces  règles  de  calcul  à 
un  cas  concret  :  l'écart  entre  les  importations  et  les  expor- 
tations, commerce  spécial,  eu  Belgique,  de  1876  à  1913. 
D 'abovd,  nous  calculons  ces  écarts,  puis  les  réduisons  à  un 
système  sériai  d'index-numbers  supposant  chaque  fois  les 
exportations  égales  à  100  l'année  correspondante  : 


Années 

Importation 

Vnnées 

Imi  orlation- 

Vnnées 

Importations 

Années 

Importations 

1876 

107.9699 

1886 

112.9507 

1896 

121.0353 

1906 

123. 1889 

1877 

131.8217 

1887 

115.4-203 

1897 

115.1650 

1907 

129.6596 

1878 

132.4008 

1888 

123.3503 

1898 

114.4219 

1908 

130  4250 

1879 

128.1515 

1889 

106.7089 

1899 

115.9519 

1909 

130.8759 

1880 

138.1471 

1890 

116.3595 

1090 

115  2307 

1910 

122.2081 

1881 

125.1177 

1891 

1 18.4842 

1901 

121.4830 

1911 

122.1327 

1882 

121.2415 

1892 

112.1958 

1902 

123.6403 

1912 

119.6824 

1883 

115.5611 

18^3 

116.1653 

1903 

125.8741 

1913 

128.1385 

1884 

106.5993 

1894 

120.7767 

1904 

127.4341 

1885 

112.2536 

1895 

121.2905 

1905 

131.0303 
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Les  variables  comptées  au  moyen  de  leurs  unités  au- 
dessus  de  100  et  exprimées  pour  la  simplification  du  calcul, 
avec  deux  décimales,  sont  rangées  dans  leur  ordre  d'impor- 
tance dans  la  première  et  seconde  colonne  du  tableau  sui- 
vant, dans  l'ordre  croissant  à  la  colonne  1  et  décroissant  à 
la  colonne  2. 


Exemple  17. 


Excédents  des  importations 
rangés  dans  l'ordre 

Différences 

entre 
les  valeurs 

Distances  gra- 
duelles enlre les 
valeurs 
symétriques 

Produits 

croissant 

décroissant 

symétriques 

ai  -  an-i+\ 

de  ai  à  an 

2 

deanàa„ 

c 

#  ■—  CL         •  i  i 
i      n  —  i  +  1 

(n  A-  i  2-1 

X  0-1-1-  2,) 

6.59 

38.15 

31.56 

37 

1167.72 

6  71 

32.40 

25.69 

35 

899.15 

7.99 

31.82 

25  83 

33 

786.39 

12.19 

31.03 

18.84 

31 

584.04 

12.25 

30.88 

18.63 

29 

540.27 

12.95 

30.42 

17.47 

27 

471 .69 

14.42 

29.66 

15.24 

25 

381.00 

15.17 

28.15 

12.98 

23 

298.54 

15.23 

28.14 

12.91 

21 

2Î1. 11 

15.42 

27.43 

12.01 

19 

228.19 

15.56 

25.87 

10.31 

17 

175.27 

15.95 

25.12 

9.17 

15 

137.55 

16  17 

23.64 

7.47 

13 

97.11 

16.36 

23.35 

6.99 

11 

76.89 

18.48 

23.18 

4.70 

9 

42.30 

19.68 

22.21 

2.53 

7 

17.71 

20.-8 

22.13 

1.35 

5 

6,75 

21.03 

21.48 

0.45 

n 

O 

1.35 

21.24 

21.29 

0.(5 

1 

0.05 

A  t=  6173,08  x  — —  =  8,781052... 
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résultat  qui  marque  la  différence  moyenne  entre  quantités 
sans  répétition,  tandis  que  la  différence  moyenne  avec  ré- 
pétition est  : 

A   =  0173,08  x  t^-z  —  8,549971... 

r  08  oo 

L'écart  entre  les  importations  et  les  exportations  n'est 
donc  pas  constant:  il  varie,  au  contraire,  dans  des  limites 
étendues. 

300.  Au  lieu  de  la  moyenne,  nous  pouvons  aussi  utiliser 
la  médiane  pour  mesurer  les  écarts  de  toute  quantité  à  une 
valeur  type.  Lorsque  le  nombre  de  termes  a  est  un  nombre 
impair,  nous  avons  : 

Médiane  (Mé)  =  an,  , 


Lorsque  ce  nombre  est  pair,  la  médiane  se  place  entre 
fl«  et  "il  +  1 

2  -i 

et  peut  prendre  toutes  les  valeurs  comprises  entre  ces  deux 
limites. 

La  différence  absolue  entre  deux  quantités  symétriques 
est  égale  à  la  somme  des  différences  entre  la  médiane  et 
chacune  de  ces  quantité»  : 

|  an_i  +  ï  —  o4  |  =  |a,  -  Mé  |  +  |  fl„_i  +  l  —  Mé  | 

La  distance  graduelle  entre  deux  quantités  symétriques 
est  égale  à  deux  fois  la  distance  graduelle  entre  une  de  ces 
quantités  et  la  médiane  (1) 

donc 


n 

a 

2 

=  22 

at  —  Mé 

i  =  1 

i  =  1 

(1)  Cfr.  Gini,  loc.  cit.,  pp.  27-28. 
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et  comme  la  distance  graduelle  entre  deux  quantités  symé- 
triques est  égale  à  deux  fois  la  distance  graduelle,  on  a 


aussi 


2  d, 

i  —  1 


i,  n  —  i 


=■  2  1  d 


i  -  1 


i,  Mé 


et 


i  d 


i  -  1 

donc 


et 


i,  n  —  1  +  1 


a  —  a 


n  —  i  +  \ 


Aid 


i  =  t 


i,  Mé 


a  —  Mé 


1  d. 


n(n  —  l)i  =  i  *<  Mé 


A  n 


a  —  Mé 


Mé 


(49) 


(50) 


A   =  —  1  d 

301.  Si  plusieurs  quantités  successives  présentent  la 
même  valeur,  il  est  préférable  de  se  servir  des  formules 
(49)  et  (50)  au  lieu  des  formules  (47)  et  (48). 

Soit  s  les  différentes  valeurs  que  prennent  les  n  quan- 
tités,     (k  =  1,  2, ...  5)  une  de  cefe  valeurs,  fh  le  nombre  de 

quantités  qui  prennent  cette  valeur,  \xk  —  Mé  j  l'écart 

entre  xh  et  la  médiane  et  dh  Mé  la  distance  graduelle 
moyenne  de  xh  à  la  médiane  (1).  Les  formules  (49)  et  (50) 
pourront  s'écrire  : 


  2  d       f  I  x  —  Mé 

n(n  —  l)ft  =  i   *>Mé   *  '  * 


IL  » 

A  =  —    2  d  f 


a:  —  Mé 


(51) 
(52) 


moyenne  de  a?  à  la  médiane  (1).  Les  formules  (49)  et  (50) 
donnent  naissance  à  des  calculs  un  peu  plus  compliqués 


(1)  La  distance  graduelle  moyenne  d'une  valeur  xfe  à  la  médiane  est  égale 
au  nombre  des  cas  compris  entre       et  la  médiane,  fu  ou  f  fc  +  )  suivant  que 

2        ~~  2 

n  est  pair  ou  impair,  /ft  étant  le  nombre  de  cas  dans  lequel  se  présente  la 
valeur  xh. 
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que  ceux  à  employer  pour  les  formules  (1)  et  (2).  On  peut 
les  décrire  de  la  manière  suivante: 

On  dresse  un  tableau  dont  la  première  colonne  est  réser- 
vée à  l'indication  des  grandeurs  dans  un  ordre  croissant; 
en  regard,  on  marque  dans  une  seconde  colonne  le  nombre 
de  fréquences  de  cette  grandeur,  et  l'on  choisit  arbitraire- 
ment une  de  ces  fréquences  comme  représentant  la  médiane 
Mé.  Dans  la  troisième  colonne,  on  marque  l'écart  entre  une 
des  quantités  et  la  médiane,  Mé  étant  figurée  par  0,  en 
augmentant  d'une  unité  à  mesure  qu'on  s'éloigne  de  la  mé- 
diane. Le  nombre  de  variables  divisé  par  2  est  l'indice 
médian;  la  distance  graduelle  moyenne  d'une  valeur  x}.  à 
la  médiane  est  égale  au  nombre  des  cas  compris  entre  xk  et 
la  médiane,  plus  /ft  +  1  ou  f  h  selon  que  le  nombre  des  n  est 

"~ 2~~  2 

pair  ou  impair.  Pour  connaître  la  distance  graduelle 
moyenne  à  porter  dans  la  quatrième  colonne,  il  faut  donc 
faire  la  différence  de  chaque  quantité  à  la  valeur  médiane, 
en  calculant  le  nombre  de  cas  compris  entre  cette  quantité 
et  la  médiane,  et  y  ajouter  le  nombre  de  variables  plus  1, 
divisé  par  2  si  le  nombre  des  n  est  pair.  Enfin  on  effec- 
tue les  produits  de  la  distance  graduelle  moyenne  à  la  mé- 
diane par  l'écart  et  par  le  nombre  de  fréquences. 

302.  Faisons  application  de  la  formule  ci-dessus  à 
l'exemple  28  du  chapitre  II  (Cfr.  n°  185),  dans  lequel  94 
amandes  sont  mesurées  dans  le  sens  de  la  longueur,  à  un 
dixième  de  millimètre  près.  Afin  d'obtenir  une  répartition 
par  classes,  nous  avons  divisé  les  variables  en  16  catégo- 
ries correspondant  à  des  mesures  variant  d'un  millimètre 
{voir  tableau  ci-après). 
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Exemple  18. 


Dimensions 
en 

millimètres 

XH 
(1) 

Nombre 
d'amandes 

h 

(21 

Écart  à  Mé 
X),  —  Mé 

(31 

Di-tance 
graduelle 
moyenne  (*) 

dh,  Mé 

(fi 

Prod 

dh,  Mé  fh 

[5 

JITS 

x}!  —  Mé 

25 

2 

7 

46 

644 

26 

5 

6 

42.5 

1275 

27 

2 

5 

39 

390 

28 

2 

4 

37 

296 

29 

11 

6 

30.5 

1006.5 

30 

8 

2 

21 

336 

31 

12 

1 

11 

132 

32 

14 

0 

33 

10 

1 

14 

140 

34 

4 

2 

21 

168 

35 

6 

3 

26 

468 

36 

9 

4 

33.5 

1206 

37 

4 

5 

40 

800 

38 

2 

6 

43 

516 

39 

2 

7 

45 

630 

40 

1 

8 

47 

376 

2 

;=  1 


d  f 

k,Më'h 


x  —  Mé 

h 


8383,5  x 


94.93 


=  8383,o 
=  3,83596 


(51) 


C'est  la  différence  moyenne  entre  quantités,  sans  répé- 
tition ;  multiplié  par 

h-  (8383-5  x  soï) 

c'est  la  différence  moyenne  avec  répétition. 

04;  Mé  — 


Exemple.  —  Nombre  n 


94 

9 


z=.  47.  Exemple  du  calcul 


«lasse  31;  variables  ayant  cette  dimension  et  moins  =  42;  donc  47 
=  11;  11  X  1  Xl2  =  132. 


42  .+ 
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303.  La  comparaison  des  degrés  de  variabilité  de  cer- 
tains phénomènes  conduit  parfois  à  des  conclusions  fort  in- 
téressantes. Il  en  est  ainsi,  par  exemple,  dans  les  recher- 
ches anthropométriques.  Le  degré  de  variabilité  de  l'indice 
céphalique,  plus  ou  moins  élevé  dans  certaines  parties  d'un 
même  pays,  montre  clairement  l'existence  de  plusieurs 
races  sur  le  sol  patrial.  D'après  les  résultats  consignés  par 
M.  Livi  dans  son  «  Anthropométrie  militaire  »  (1898), 
M.  le  docteur  G.  Dettori  a  calculé  les  différences  moyennes 
entre  indices  céphaliques  des  hommes  astreints  au  service 
militaire,  répartis  d'après  leur  province  d'origine.  Voici  le 
résultat  de  ces  recherches  (1)  : 


Provinces 

Différence 
moyenne 
en  Ire 
inilices 

Numéros 
d'ordre 

Provinces 

Différer  e 
movenne 
entre 
indices 

Numéros 
d'ordre 

Vénétie 

4.17 

14 

Latium 

4.73 

4 

Lombardie 

3.95 

16 

Abruzzes 

4.61 

5 

Piémont 

4.39 

8 

Pouilles 

4.48 

6 

Ligurie 

4.26 

13 

Campanie 

4  26 

12 

Emilie 

4.38 

9 

Sardaigne 

4.37 

10 

Toscane 

5.06 

2 

Basilicate 

4.47 

7 

Marche 

5.19 

1 

Ci.  labre 

4.33 

11 

Ombrie 

4.74 

3 

Sicile 

4.15 

15 

D'après  les  chiffres  ci-dessus,  on  remarquera  une  varia- 
bilité plus  grande  dans  les  provinces  centrales  que  dans 
les  provinces  du  nord  et  du  sud.  Cette  constatation,  fait 
observer  M.  Gini,  est  d'accord  avec  les  théories  anthropo- 
logiques d'après  lesquelles  les  populations  du  nord  et  du 
sud  de  l'Italie  appartiennent  à  deux  races  distinctes  qui  se 
seraient  fusionnées  ou  juxtaposées  dans  la  partie  centrale 
de  la  péninsule. 


(1)  D'après  le  tableau  reproduit  dans  l'ouvrage  cité  du  professeur  Corrado 
Gini,  p.  81. 
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CHAPITRE  IV 


Covariation  (Corrélation). 

I.  —  Portée  du  coefficient  de  covariation;  sphère  d'application; 
examen  critique  général. 

305.  Depuis  un  certain  nombre  d'armées  on  a  fait  usage, 
spécialement  dans  les  sciences  biologiques,  en  anthropolo- 
gie et  en  botanique,  de  formules  mathématiques  ayant  pour 
objet  d'apprécier  l'étroitesse  des  rapports  —  ressemblance 
ou  dissemblance  —  existant  entre  deux  faits  distincts.  Ces 
formules  ont  pour  but  de  représenter  schématiquement  une 
quantité  de  constatations  qui  pourraient  être  faites  à  pro- 
pos de  chacune  des  données  numériques  des  séries.  Il  s'agit 
bien  ici,  encore  une  fois,  de  ces  procédés-  d'analyse  qui,  ap- 
pliqués aux  résultats  des  investigations  scientifiques,  ré- 
sument, en  une  expression  abrégée,  la  multitude  des  chif- 
fres et  servent  de  guide  et  de  soutien  à  l'esprit.  Cette 
réflexion  n'est  pas  inutile  au  seuil  de  la  matière  difficile 
qui  nous  occupe,  car  elle  nous  rappelle  que  les  symboles  ne 
peuvent  avoir  une  signification  plus  étendue  ou  plus  pro- 
fonde que  les  phénomènes  qu'ils  représentent  :  exprimés 
au  moyen  des  formules  d'où  se  tire  le  coefficient  r,  les 
faits  que  l'on  compare  ne  sont  pas  plus  étroitement  liés  l'un 
à  l'autre  que  quand  on  les  considère  dans  leurs  données 
simples  et  qu'on  recherche,  par  les  procédés  logiques,  les 
rapports  qui  peuvent  exister  entre  eux.  Ce  n'est  pas  parce 
que  le  coefficient  sera  élevé  que  l'on  pourra,  d'une  ma- 
nière absolue,  conclure  à  l'étroitesse  des  liens  existant 
entre  les  deux  séries  mises  en  équation.  Le  coefficient  r  a 
donc  une  fonction  représentative;  il  importe,  avant  tout, 
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pour  l'homme  de  science,  de  ne  pas  se  laisser  entraîner  loin 
dn  terrain  solide  des  faits  et  de  ne  pas  oublier  que  les  sym- 
boles statistiques,  création  de  notre  esprit,  ne  peuvent  va- 
loir contre  les  réalités. 

A  une  époque  plus  récente,  les  procédés  de  calcul  dont 
nous  venons  de  parler  ont  été  étendus  à  la  sphère  des  phé- 
nomènes économiques  et  moraux,  quoique  avec  assez  d'hé- 
sitation; les  applications  de  ces  méthodes  mathématiques, 
dans  ce  domaine,  étaient,  en  1909,  encore  assez  rares  pour 
que  M.  Udny  Yule  eût  la  possibilité  de  les  énumérer  toutes 
dans  un  mémoire  succinct  adressé  à  l'Institut  international 
de  statistique  (1).  Bien  que  ce  fait  ne  prouve  rien  contre  la 
valeur  des  méthodes  —  valeur  du  reste  incontestable,  sauf 
les  abus  qui  peuvent  être  commis  parfois'  —  il  est  assez 
significatif  d'autre  part  quant  à  la  difficulté  de  trouver 
un  terrain  qui  se  prête  sans  contestation  à  l'application  du 
coefficient. 

Les  formules  dites  de  «  corrélation  »  présentent  une  con- 
nexion étroite  avec  la  théorie  des  erreurs,  spécialement 
avec  la  méthode  des  moindres  carrés  (2).  C'est  pourquoi 
on  peut,  à  ce  point  de  vue  spécial,  faire  remonter  à  Bravais 
(1846),  les  origines  de  la  méthode,  car  la  formule  de  la 
somme  des  produits  peut  être  regardée  en  un  certain  sens 
comme  étant  due  à  ce  savant.  Mais  Sir  Francis  Galton  fut 
le  premier  à  imaginer  la  méthode  statistique  pratique 
(1886-1888)  et  c'est  à  lui  que  nous  devons  l'idée  d'une 
mesure  numérique  de  la  a-randeur  de  corrélation.  Edge- 
worth  et  Pearson  ont  amplifié  et  perfectionné  les  procédés 


(1)  L'exposé  des  applications  nouvelles  Je  la  méthode  des  covariations 
mériterait  une  étude  spéciale,  qui  ne  sera't  pas  dépourvue  d'intérêt.  Nous 
n'avons  pu  l'entreprendre  parce  qu'un  travail  de  ce  genre  ne  rentre  pas 
dans  le  cadre  d'un  ouvrage  général  tel  que  le  nôtre,  mais  nous  souhaitons 
que  ce  sujet  tente,  sans  tarder,  l'un  ou  l'autre  chercheur. 

(2)  Cfr.  Udny  Yule  :  «  Les  applications  de  la  méthode  de  corrélation  aux 
statistiques  sociales  et  économiques  ».  (Bulletin  de  l'Institut  International  de 
statistique,  t.  XVIII,  1009,  traduction  française,  pp.  265-277,  texte  anglais, 
p.  537.) 


COVAUIATION 


479 


de  Galton;  c'est  Pearson  qui  a  introduit  dans  la  pratique 

(1896)  la  formule  de  la  somme  de  produits  pour  exprimer 

le  coefficient  r  :  enfin,  de  nombreux  savants,  clans  une 

1 

série  de  travaux  remarquables,  ont  fait  de  nombreuses 
applications  de  la  méthode,  l'ont  encore  développée  et  per- 
fectionnée et  ont  contribué  pour  une  large  part  à  la  faire 
connaître  dans  le  monde  des  économistes  et  des  statisti- 
ciens (1). 

306.  En  règle  très  générale,  la  méthode  est  connue  sous 
le  nom  de  méthode  de  corrélation. 

Avec  M.  Lucien  Marcb,  nous  regrettons  que  ce  terme 
soit  entré  dans  le  vocabulaire  statistique,  à  cause  du  sens 
qu'il  a  en  logique  et  dans  le  langage  courant,  sens  qui  n'est 
pas  celui  qu'il  a  en  statistique. 

Lorsqu'on  dit  qu'un  fait  est  en  corrélation  avec  un  autre, 
on  veut  exprimer  habituellement  qu'un  de  ces  faiés  est 
dans  une  relation  telle  avec  l'autre,  que  l'un  suppose 
l'autre  (Littré).  En  logique,  le  caractère  corrélatif  de  deux 
phénomènes  implique  l 'existence  entre  eux  d 'un  lien  causal. 

Certains  auteurs,  qui  se  sont  attachés  au  côté  mathéma- 
tique de  la  question  plutôt  qu'à  son  aspect  philosophique, 
n'ont  pas  hésité  à  écrire  que  l'existence  d'une  corrélation, 
d'un  degré  assez  élevé,  entre  deux  phénomènes  supposait 
l'existence  du  principe  de  causalité  (2).  D'aucuns  se  sont 
montrés  moins  affirmatifs  et  se  sont  bornés  à  dire  que  des 
fluctuations  dans  le  même  sens  ou  dans  un  sens  opposé,  en 
grand  nombre,  démontraient  qu'entre  les  deux  phénomènes 
il  existait  une  relation  dont  le  caractère  plus  ou  moins 
étroit  est  mesuré  par  le  coefficient  de  corrélation.-  Cette 
opinion,  bien  que  plus  modérée  que  la  première,  n'est  pas 
admise  par  M.  Mardi  qui  écrit  ceci  :  «  le  résultat  d'un  cal- 


(1)  Citons  parmi  eux  les  statisticiens  anglais,  italiens  et  américains,  spé- 
cialement MM.  L.  Bowley,  G.  Udny  Yule,  G.  Mortara,  C.  Gini,  Turroni 
Bresciani,  etc. 

(2)  King,  Eléments  of  statistical  methods,  n°  100.  p.  107. 
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cul  ne  peut  mesurer  la  relation  effective  de  deux  séries  de 
phénomènes  ;  ce  résultat  peut  accuser,  en  effet,  une  relation 
apparente  très  étroite  alors  que  la  relation  réelle  est  nulle 
ou  de  sens  opposé  à  la  relation  apparente.  La  relation 
de  deux  séries  de  grandeurs  peut  d'ailleurs  s'entendre  de 
diverses  façons  :  si  l'on  décompose,  par  exemple,  le  mouve- 
ment des  termes  d'une  série  chronologique  en  changements 
à  longue  et  changements  à  courte  période,  la  relation  peut 
avoir  un  certain  sens  pour  les  premiers,  un  autre  sens  pour 
les  seconds  (1).  » 

Nous  partageons  l'avis  de  M.  L.  Mardi  et  nous  pen- 
sons avec  lui  que  l'on  a  dépassé  la  portée  des  conclu- 
sions légitimes  lorsqu'on  a  donné  à  la  méthode  le  nom  de 
corrélation.  Celui  de  covariation,  qui  implique  seulement 
l'existence  d'une  concomitance  entre  les  variations  des 
phénomènes,  est  proposé  et  employé  par  M.  March,  et  nous 
adoptons  cette  terminologie  pour  les  motifs  indiqués  plus 
haut. 

307.  Si  le  coefficient  de  covariation  ne  peut  nous  rensei- 
gner exactement  au  sujet  de  l'existence  d'un  lien  causal 
entre  deux  phénomènes  que  l'on  compare,  quelle  est  donc 
au  juste  sa  fonction  et  sa  signification?  Est-ce  un  jeu  de 
l'esprit,  une  superfétation  mathématique,  une  satisfaction 
donnée  à  une  mode  momentanée  ou  au  désir  de  paraître 
plus  savant,  d'imprimer  à  l'œuvre  statistique  un  cachet 
plus  rigoureusement  scientifique  qu'on  ne  le  pourrait  à 
l'aide  des  raisonnements  de  la  simple  logique?  Le  préten- 
dre serait  singulièrement  et  fort  injustement  rabaisser  la 
portée  théorique  et  pratique  de  la  méthode.  En  effet,  les 
calculs  par  lesquels  se  détermine  le  coefficient  de  covaria- 
tion ont,  sans  conteste,  une  grande  utilité.  En  premier  lieu, 


(1)  Maroh  (L.  ),  «  De  l'application  de  procédés  mathématiques  à  la  com- 
paraison des  statistiques  ».  (Bull.  Instit.  Intcm.  Stat.,  vol.  XVIII,  1909, 
p.  262.) 
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l'indice  de  covariation  précise  le  degré  de  parallélisme  ou 
d'antiparallélisme  des  courbes.  Il  ne  suffit  pas  de  constater 
que  les  séries  sont  formées  de  nombres  dont  la  succession 
est  à  peu  près  la  même  de  part  et  d'autre,  ou  est  en  sens 
opposé;  il  faut  encore  préciser  ces  ressemblances  ou  ces 
divergences.  Quiconque  a  essayé  d'interpréter  un  matériel 
statistique  s'est  heurté,  l'une  ou  l'autre  fois,  à  une  diffi- 
culté de  l'espèce.  Or,  le  coefficient  de  covariation  donne 
l'expression  la  plus  exacte  possible  en  cette  matière.  Ce 
premier  avantage  est  déjà  notable. 

Il  nous  semble  que,  sous  un  autre  rapport,  les  calculs 
de  l'espèce  ont  une  utilité  qu'on  ne  peut  non  plus  sous-éva- 
luer  :  celle  d'orienter  les  réflexions  du  chercheur  dans  un 
sens  déterminé.  Au  début  du  processus  du  raisonnement 
logique,  l'esprit  hésite  entre  plusieurs  hypothèses  plau- 
sibles :  existerait-il  un  rapport  entre  tel  phénomène  et  tel 
autre  1  Au  contraire,  la  constatation  du  fait  A  signif ie-t-elle 
que  le  fait  B  ne  se  produira  pas?  Le  coefficient  de  covaria- 
tion peut  fournir  une  première  réponse  à  cette  question. 
Une  valeur  élevée  de  ce  coefficient  doit  nous  faire  réfléchir 
à  la  possibilité  d'une  union  entre  phénomènes,  même  éloi- 
gnés l'un  de  l'autre;  dans  le  sens  opposé,  une  valeur  faible 
du  même  coefficient  pourra  nous  dissuader  d'associer  trop 
intimement  deux  ordres  d'idées  que  nous  serions  enclins 
à  trouver  voisins. 

Enfin,  le  coefficient  de  covariation  a  un  rôle  à  jouer  dans 
la  vérification  de  nos  raisonnements  et  ce  n'est  pas  là  un 
office  dont  l'importance  soit  à  dédaigner. 

Ces  points  de  vue  sont  excellemment  résumés  par  un 
auteur  déjà  cité  lorsqu  'il  écrit  :  «  Dans  l 'enchaînement  des 
opérations  logiques  de  l'esprit,  l'intervention  des  procédés 
mathématiques  dans  les  comparaisons  statistiques  a  une 
utilité  évidente  aux  extrémités  de  la  chaîne  :  au  point  de 
départ  pour  suggérer  des  conclusions  possibles,  ou  à  la  fin 
pour  contrôler  la  partie  analytique  du  processus  :  elle  ne 
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peut,  en  aucune  façon,  constituer  le  nœud  même  du  raison- 
nement (1).  » 

Ces  derniers  mots  sont  à  retenir.  Les  formules  mathé- 
matiques —  et  celles  de  la  covariation  en  premier  lieu  — 
ne  dispensent  pas  de  raisonner;  lorsque  la  valeur  de  r  est 
déterminée,  on  n'a  pas  tout  fait.  Quelques-uns  ont  paru 
penser  que  le  raisonnement  logique  pouvait  être  remplacé 
par  l'emploi  des  formules  appropriées  à  la  recherche  des 
connexions  entre  les  séries  statistiques;  dans  notre  opi- 
nion, cette  prétention  est  injustifiable  et  aboutirait  à  des 
confusions  regrettables. 

Le  coefficient  de  covariation  est  essentiellement  un 
guide  pour  l 'esprit,  au  début  et  à  la  conclusion  de  la  recher- 
che scientifique.  On  peut  même  aller  plus  loin  et  dire,  avec 
M.  Udny  Yule  que  la  grandeur  du  coefficient  de  covaria- 
tion montre  l'amplitude  de  l'écart  à  attendre  dans  un  phé- 
nomène donné,  par  rapport  à  la  moyenne,  pour  un  certain 
écart  constaté  dans  un  phénomène  connexe,  à  condition 
qu'on  puisse  juger  de  l'avenir  d'après  les  données  du 
passé  (2)  :  cette  conclusion  peut  être  étendue  à  tous  les 
coefficients,  même  calculés  par  les  voies  les  plus  simples. 
Quant  à  la  connexion  causale,  on  peut  dire  que  le  parallé- 
lisme des  courbes  démontre  la  concomitance  des  mouve- 
ments représentés  et  qu'il  permet  seulement  de  soupçonner 
la  connexité,  la  dépendance  des  circonstances  qui  déter- 
minent les  mouvements  (3). 

308.  La  sphère  d'application  de  la  méthode  de  covaria- 
tion aux  phénomènes  sociaux  et  économiques  est,  avons- 
nous  dit,  assez  étroite.  Nous  ne  reprendrons  pas  ici  l'exa- 

(1)  Makch  (L.),  «  De  l'application  des  procédés  mathématiques  à  la  com- 
paraison des  statistiques  ».  (Bull.  Instit.  Intern.  Stat.,  vol.  XVIII,  1909, 
p.  261.) 

(2)  Yule  (G.  U.),  «  Les  applications  de  la  méthode  de  corrélation  aux 
statistiques  sociales  et  économiques  ».  (Bull.  Instit.  Intern.  Stat.,  t.  XVIII, 
1909,  trad.  franc.,  p.  266.) 

(3)  March  (L.),  «  Comparaison  numérique  des  courbes  statistiques  ». 
(Journal  de  la  Société  de  Statistique  de  Paris,  1905,  p.  256.) 
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men  détaillé  auquel  il  a  été  procédé  par  M.  Udny  Yule  dans 
son  mémoire  à  l'Institut  international  de  statistique,  exposé 
qui  devrait  être  complété.  Cependant  le  lecteur  doit  con- 
naître l'étendue  du  domaine  auquel  se  sont  attachées,  en 
matière  économique  et  sociale,  les  premières  recherches  du 
coefficient  de  variation  et  force  nous  est  de  répéter,  en 
partie  et  sous  une  forme  succincte,  certaines  choses  que 
l'on  a  dites  avant  nous. 

Les  premiers  exemples  d'application  de  la  formule  de 
covariation  à  des  phénomènes  économiques  remontent  à 
1895  et  1896;  ce®  recherches,  faites  par  M.  Udny  Yule, 
avaient  pour  objet  de  vérifier  si  l'assistance  des  pauvres  à 
domicile,  dans  l'organisation  de  la  bienfaisance  publique 
en  Angleterre,  avait  une  influence  marquée  sur  l'accroisse- 
ment du  paupérisme.  Des  recherches  sur  le  même  objet, 
plus  développées,  et  dans  lesquelles  les  variations  du  pau- 
périsme étaient  mises  en  rapport  avec  d'autres  éléments, 
furent  publiées  par  le  même  auteur  quelques  années  plus 
tard. 

Une  question  ayant  fait  l'objet  de  fréquentes  recherches 
est  celle  des  rapports  qui  existent  entre  la  nuptialité  et  les- 
circonstances  économiques,  telles  que  le  développement  du 
commerce,  des  affaires  ou  le  bon  marché  de  la  vie  (mesuré 
approximativement  par  les  variations  du  prix  du  blé).  De 
nombreux  économistes  ont  consacré  des  études  à  ce  pro- 
blème et  tous,  à  peu  près,  ont  conclu  à  une  action  des 
conjonctures  économiques  sur  le  taux  de  la  nuptialité. 
M.  Hooker  a  entrepris  de  donner  une  forme  mathématique, 
celle  du  coefficient  de  covariation,  à  des  recherches  ana- 
logues. Son  travail,  qui  a  introduit  une  méthode  nouvelle 
de  mesurer  les  écarts  en  les  ramenant  à  la  moyenne  d'une 
courte  période  et  non  à  la  moyenne  de  la  période  entière, 
conclut  à  l'existence  d'une  liaison  entre  le  taux  de  la  nup- 
tialité et  le  mouvement  dans  les  «  clearing-house  »  quelque 
quinze  mois  auparavant,  tandis  que  la  connexité  avec  le 
prix  du  blé  paraît  très  faible. 
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A  son  tour,  M.  Lucien  March,  s 'aidant  d'une  méthode 
simple  que  nous  analyserons  plus  loin,  a  fait  des  applica- 
tions de  la  méthode  de  covariation,  comme  il  l'a  appelée  lui- 
même,  à  des  questions  démographiques  et  économiques, 
telles  que  les  fluctuations  du  taux  des  mariages  et  des  nais- 
sances et  du  coefficient  de  nuptialité  et  du  chômage. 
M.  Yule,  un  peu  plus  tard,  sans  connaître  le  travail  de 
M.  March,  a  traité  des  données  analogues  et  a  longuement 
discuté  la  nature  réelle  de  la  relation  entre  les  fluctuations 
du  taux  du  mariage  et  du  commerce. 

La  fécondité  et  le  milieu  social  ont  déjà  été  analysés  par 
différents  économistes  et  démographes.  M.  Héron  a  repris 
l'étude  du  problème  sous  son  aspect  mathématique. 

On  a  encore  essayé  de  mesurer  l'influence  du  temps  sur 
les  récoltes  et  les  conclusions  de  M.  Hooker  sur  ce  sujet  ne 
manqueront  pas  d'intéresser  les  agronomes  et  les  écono- 
mistes. 

Les  questions  boursières  ont  été  analysées  par  M.  Hoo- 
ker dans  ses  deux  études  successives  sur  l'effet  de  la  sus- 
pension de  la  Bourse  de  Berlin  et  par  M.  Norton  (rapport 
des  réserves  et  de  l'escompte). 

Enfin,  on  s'est  demandé  si  le  taux  d'accroissement  de 
l'importation  en  Angleterre,  des  objets  manufacturés  avait 
une  influence  sur  le  nombre  de  membres  non  chômeurs 
dans  certaines  ((  Trade-Unions  ».  Nous  aurons  plus  loin 
l'occasion  d'analyser,  au  point  de  vue  critique,  cette  appli- 
cation de  la  méthode  de  covariation.  (Cfr.  n"  30.) 

Depuis  que  le  mémoire  de  M.  Yule  a  paru,  de  nouvelles 
applications  de  la  méthode  ont  été  faites  à  d'autres  sujets 
du  même  genre  (1).  Les  indications  qui  précèdent  n'ont  pas 


(1)  Signalons,  par  exemple,  l'étude  de  M.  Marcel  Lenoir  :  «  Prix,  production 
et  consommation  de  quelques  marchandises  (charbon,  blé,  coton,  café)  »,  parue 
dans  le  Bulletin  de  la  Statistique  générale  de  la  France,  t.  I  (octobre  1912- 
juillet  1913),  Paris,  Alcan,  pp.  172-214.  Dans  cet  important  mémoire  l'auteur 
a  calculé  le  coefficient  de  corrélation  entre  le  stock  existant  en  charbon  sur 
le  carreau  de  la  mine  et  le  prix  de  la  tonne  (r=  —  0.71),  entre  les  oscillations 
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le  caractère  d'une  notice  bibliographique;  elle  n'ont 
cl 'autre  objet  que  de  faire  connaître  au  lecteur  les  sujets  qui 
ont  paru  s'adapter  le  mieux  au  calcul  de  la  covariation.  On 
aura  déjà  remarqué  que  les  principales  relations  entre 
deux  ou  plusieurs  phénomènes  économiques  avaient  été  in- 
diquées longtemps  avant  qu'on  eût  songé  au  coefficient 
de  covariation.  William  Farr,  par  exemple,  bien  longtemps 
auparavant,  considérait  les  oscillations  du  taux  des  ma- 
riages comme  une  sorte  de  baromètre  de  la  situation  écono- 
mique. La  relation  entre  l'encaisse  et  l'escompte  était  clas- 
sique longtemps  avant  qu'on  n'eût  prononcé  le  mot  de  coeffi- 
cient de  covariation.  Ce  n'est  donc  pas  une  invention  que 
nous  devons  à  l'emploi  de  cette  méthode  mathématique, 
mais  une  confirmation  et  une  précision.  Le  coefficient  de 
covariation  joue  exactement  son  rôle  de  guide  de  l'esprit  : 
il  confirme  et  précise  les  conclusions  simples  basées  sur  la 
logique,  sans  remplacer  l'effort  du  raisonnement. 

309.  Comme  le  fait  très  justement  observer  M.  Yule,  le 
coefficient  de  covariation  exprime,  en  une  forme  sommaire 
et  compréhensible,  un  aspect  particulier  des  faits  sur  les- 
quels il  est  basé,  de  sorte  que  les  difficultés  véritables  com- 
mencent quand  il  s'agit  d'interpréter  le  coefficient  ainsi 
obtenu  (1).  En  d'autres  termes,  tout  dépend  de  la  correc- 
tion avec  laquelle  les  faits  qu'on  désire  comparer  sont  asso- 
ciés. Si  cette  association  a  été  faite  suivant  les  principes 
logiques,  on  obtient  un  coefficient  présentant  une  valeur 


du  prix  et  de  la  consommation  (=  +  0.59  entre  1876  et  1905),  entre  les 
quatre  variables  suivantes  :  prix  moyen  de  la  houille  en  Europe,  accrois- 
sement moyen  de  la  production  de  la  houille  en  Europe,  production  moyenne 
de  métal  monnaie,  et  le  temps  (prix  et  accroissement  de  la  production 
=  —  0.34;  ■ —  prix  et  production  du  métal  monnaie  or  et  argent  :  -4-  0.73, 
or  seul  =  -[-0.82.  Des  calculs  analogues  sont  établis  pour  les  autres  mar- 
chandises. On  trouvera  p.  214  de  la  publication  susmentionnée  un  Appendice 
renfermant  un  exemple  du  calcul  des  coefficients  de  corrélation  et  des  équa- 
tions de  régression. 

(1)  Yule  (U.  G.),  An  introduction  to  the  theory  of  statistics,  p.  191. 
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sérieuse;  dans  le  cas  contraire,  on  aboutit  au  résultat  op- 
posé. C'est  pourquoi,  avant  de  procéder  aux  calculs  assez 
laborieux  qu'exige  la  détermination  du  coefficient  de  cova- 
riation,  il  importe  de  bien  préciser  la  nature  des  données 
et  de  vérifier  si  la  comparaison  de  certains  éléments  n'est 
pas  plus  suggestive  et  plus  exacte  que  celle  qui  porte  sur 
d'autres  points.  La  nécessité  de  cet  examen  prouve,  une 
fois  de  plus,  que  le  nœud  du  raisonnement  ne  consiste  pas 
dans  l'application  des  formules  mathématiques. 

Essayons  de  marquer  cette  nécessité  en  discutant  les  élé- 
ments à  rapprocher  dans  l'étude  d'une  des  questions  signa- 
lées dans  la  revue  sommaire  que  nous  avons  faite  des  appli- 
cations de  la  méthode  de  covariation  aux  problèmes  écono- 
miques et  sociaux.  (Cfr.  n°  308.)  Il  s'agit  de  savoir  si  l'aug- 
mentation de  la  valeur,  d'une  année  à  l'autre,  des  articles 
entièrement  ou  en  majeure  partie  manufacturés,  importés 
en  Angleterre,  a  une  influence  sur  la  proportion  des  mem- 
bres non-chômeurs  des  «Trade-Unions».  L'auteur  (1)  pose 
ainsi  le  problème:  ((  que  faut-il  penser  de  l'argument  des 
partisans  de  la  réforme  du  tarif, consistant  à  dire  :  l'importa- 
tion de  produits  manufacturés  favorise  l 'emploi  de  la  main- 
d 'œuvre  à  l'étranger,  au  lieu  des  ouvriers  anglais?  »  Se  ba- 
sant sur  un  rapport  du  «  Board  of  Trade  »  (1906)  relatif  au 
marché  du  travail  et  à  l'importation  de  produits  manufac- 
turés, l'auteur,  dans  un  tableau  portant  sur  les  années  1860 
à  1904,  établit  :  a)  le  chiffre  de  l'importation  (valeur)  des 
produits  manufacturés  (en  milliers  de  livres);  A')  le  taux 
d'augmentation  de  la  valeur^des  articles  importés  par  rap- 
port à  l'année  précédente;  b)  le  pourcentage  des  ouvriers 
au  travail,  d'après  les  renseignements  fournis  par  les 
«  Trade-Unions  »  ;  B  ')  le  taux  des  changements  survenus 


(1)  Lee  (Miss  Alice)  «  On  tlie  manner  in  winch  the  pereentage  of  employod 
workmen  in  tins  countiy  is  related  to  the  import  of  articles  wholly  or  mainly 
manufacturai  ».  (Economie  Journal,  1908,  vol.  18,  p.  90.) 
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dans  le  pourcentage  des  ouvriers  au  travail  (1).  L'auteur 
a  calculé  le  coefficient  de  corrélation  entre  A'  et  b  et  entre 
A  '  et  B  '  ;  il  obtient  respectivement  0.31  ±  0.09  et  0.47  ±  0.08. 
La  conclusion  est  qu'une  importation  plus  considérable 
d'articles  manufacturés  est  concomitante  avec  une  propor- 
tion plus  considérable  d'hommes  au  travail  et  qu'une  dimi- 
nution de  ces  importations  augmente  le  manque  de  tra- 
vail (2). 

310.  Le  procédé  de  l'auteur  étant  ainsi  décrit,  nous  nous 
poserons  la  question  de  savoir  si  le  problème  était  suscep- 
tible d'une  solution,  étant  donnés  les  éléments  dont  on  dis- 
posait, et  si  les  éléments  à  soumettre  au  calcul  étaient  bien 
choisis. 

En  ce  qui  concerne  le  premier  point,  des  doutes  sérieux 
peuvent  être  élevés  à  raison  des  considérations  ci-après  : 

A.  —  Nature  des  produits  compris  sous  la  dénomination 
générale  :  Objets  manufacturés.  Dans  les  statistiques  com- 
merciales, indépendamment  des  dénominations  s 'appli- 
quant aux  produits  ou  aux  classes  de  produits,  on  trouve 
généralement  des  nomenclatures  plus  larges  qui  ont  pour 
objet  de  donner  une  idée  de  la  nature,  dans-  leur  ensemble, 
des  transactions.  En  Angleterre  (3),  les  quatre  groupes  sui- 
vants existaient  à  l'époque  envisagée  :  1°  substances  ali- 
mentaires, boissons  et  tabac  ;  2°  matières  premières  et  arti- 
cles complètement  bruts  ;  3°  articles  complètement  ou  partiel- 
lement manufacturés  ;  4°  articles  divers  et  non  classés.  Les 


(1)  Obtenu  en  divisant  la  différence  entre  la  première  année  et  la  seconde 

par  la  proportion  du  nombre  d'ouvriers  au  travail  la  seconde  année.  Ex.  : 

98.15  —  96.30  1.85 

année  1800  =  98.15;  1861  —  96.30;  taux  cherché  =  —  — 

96.30  96.30 

—  0.0192.  (Cfr.  Miss  Alice  Lee,  loc.  cit.,  pp.  99). 

(2)  Lee  (Miss  Alice),  op.  cit.,  loc.  cit.,  p.  99. 

(3)  Voyez  un  résumé  de  la  statistique  commerciale  anglaise  dans  notre 
Précis  du  cours  de  statistique  pénéralc  et  appliquée,  3e  édit.,  Bruxelles, 
1912,  nos  206  et  207. 
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données  utilisées  sub  litt.  A  visent  les  articles  compris  dans 
la  troisième  division. 

Il  est  de  toute  évidence  que  sous  cette  rubrique,  tout  à 
fait  générale,  sont  comptées  beaucoup  de  marchandises  dis- 
parates. Combien  y  en  a-t-il,  parmi  elles,  qui  intéressent  le 
travail  d'ouvriers  anglais?  On  ne  le  sait,  mais  ce  qu'on  peut 
affirmer  c'est  que  maints  produits  de  luxe  ou  de  fantaisie, 
qui  ne  sont  pas  fabriqués  en  Angleterre,  trouvent  dans  ce 
pays  un  marché  très  avantageux.  Il  n'est  pas  possible  de 
prétendre  que  l'importation  de  ces  objets  nuise,  en  aucune 
façon,  à  l'ouvrier  anglais  en  le  privant  de  son  travail,  puis- 
qu'il s'agit  d'industries  qui  n'ont  pas  ou  presque  pas 
d'équivalent  en  Grande-Bretagne.  Quant  à  soutenir  que 
l'argent  dépensé  pour  ces  importations  aurait  appauvri  le 
fonds  des  salaires  et  de  la  sorte,  aurait  empêché  de  donner 
de  l'ouvrage  à  un  plus  grand  nombre  de  travailleurs,  on 
sait  que  cette  théorie  du  fonds  des  salaires,  tout  à  fait  dé- 
modée aujourd'hui,  n'a  plus  besoin  d'être  réfutée. 

Le  rapport  entre  l'état  du  marché  du  travail  et  l'im- 
portation d'objets  manufacturés  ne  peut  être  recherché 
avec  chance  de  succès  que  si  l'on  compare  des  industries 
homogènes,  non  si  l'on  s'en  tient  à  des  généralités.  Les 
termes  trop  généraux  dans  lesquels  le  problème  est  posé 
ne  permettent  pas  de  lui  donner  une  solution  certaine  par 
l 'emploi  de  la  méthode  de  covariation. 

B.  —  Les  changements  de  valeur,  d'une  année  à  l'autre, 
des  importations  de  produits  manufacturés,  ont  été  choisis 
par  l'auteur  pour  être  mi&  en  corrélation  avec  le  pourcen- 
tage d'ouvriers  au  travail.  Cette  méthode  n'échappe  pas  à 
l'inconvénient  de  faire  dépendre  le  taux  d'augmentation 
des  mouvements  annuels  et  séculaires  des  prix.  Pendant 
une  période  de  dépression  économique  l'augmentation  de 
valeur  sera  arrêtée  ou  même  fera  place  à  une  réduction  ;  au 
contraire,  au  cours  d'une  période  d'expansion,  on  verra  les 
accroissements  annuels  atteindre  un  taux  élevé.  Les  deux 
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cas  peuvent  se  produire  sans  qu'il  y  ait  aucun  changement 
effectif  dans  les  quantités. 

Il  nous  semblerait  préférable  de  calculer  la  part  relative 
des  importations  d'objets  manufacturés  dans  le  total  des 
importations  d'une  année  et  de  comparer,  d'une  année  à 
l'autre,  les  modifications  survenues  dans  ces  proportions. 
Cette  méthode  échappe  presque  entièrement  aux  influences 
des  changements-  de  prix  parce  que  l'on  base  le  calcul  des 
parts  relatives  sur  les  résultats  d 'une  seule  année. 

Il  eût  été  désirable  de  n'utiliser  que  les  données  expri- 
mant le  pourcentage  d'ouvriers  au  travail  dans  des  métiers 
produisant  des  objets  manufacturés,  au  lieu  de  choisir 
ceux  qui  se  rapportent  à  la  masse  ouvrière  tout  entière. 
La  précaution  était  d'autant  plus  recommandable  que,  pays 
de  grande  industrie.  l'Angleterre  compte  un  grand  nombre 
d'ouvriers  occupés  à  la  préparation  de  matières  premières 
ou  d'articles  complètement  bruts. 

C.  —  Il  est  enfin  à  remarquer  que  la  variation  du  mou- 
vement du  commerce  est  de  courte  période  ;  comme  le  fait 
remarquer  M.  Yule,  dans  une  période  de  commerce  très  in- 
tense, ses  importations  de  tout  genre  s'élèvent  et  le  travail 
s'accroît.  Nous  pensons  avec  notre  éminent  collègue  que 
((  la  méthode  ne  paraît  pas  propre  à  élucider  l'existence  ou 
la  non-existence  d'une  relation  séculaire  ». 

II.  —  Indice  de  dépendance. 

311.  Il  n'en  reste  pas  moins  vrai  que  l'esprit  tient  à  pos- 
séder des  notions  précises  sur  le  degré  de  concordance  exis- 
tant entre  deux  séries  ou  deux  courbes  à  mettre  en  compa- 
raison. Les  procédés  qui  visent  à  atteindre  ce  résultat  ont 
une  utilité  analogue  à  celle  de  la  moyenne.  Cette  mesure  est 
une  expression  synthétique  d'une  série;  les  indices  de  cova- 
riation  jouent  le  même  rôle  quant  à  la  ressemblance  de 
doux  ou  de  plusieurs  séries.  Il  ne  faut  donc  pas  s'étonner 
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que  des  essais  nombreux  aient  été  faits  en  vue  de  trouver 
une  expression  synthétique  suffisamment  compréhensive, 
sensible  et  exacte.  Parmi  les  auteurs  qui  ont  abordé  ce  pro- 
blème, il  faut  citer  Fechner  qui  est  l'auteur  de  l'indice 
du  coefficient  de  dépendance  et  ensuite  M.  March  (1)  qui  a 
exposé  la  matière  avec  une  grande  clarté  et  dont  nous  uti- 
liserons plus  d'une  fois  le  savant  travail. 

Cette  détermination  est  basée  sur  l'idée  très  simple  de  la 
comparaison  des  courbes  statistiques. 

Lorsque  deux  faits  statistiques  sont  exprimés  au  moyen 
de  courbes,  on  se  trouve  porté,  comme  malgré  soi,  à  compa- 
rer ces  courbes  entre  elles  et  à  évaluer  les  différences  et 
les  ressemblances  qu'elles  présentent.  Si  les  deux  courbes 
ont  une  allure  identique,  si  l'une  s'élève  quand  l'autre 
s'élève,  et  descend  quand  l'autre  descend,  on  dira  qu'elles 
sont  parallèles  et  que  les  phénomènes  qu'elles  expriment 
sont  liés  entre  eux,  ou  sont  dominés  par  une  cause  exté- 
rieure qui  les  conditionne  tous  deux.  Dans  l'ordre  des 
choses  économiques  et  sociales,  ce  parallélisme  parfait  est 
d'une  telle  rareté  qu'il  est  permis  de  dire  que,  pratiquement, 
il  n'existe  pas.  Mais,  sans  atteindre  ce  degré  d'union  avec 
un  phénomène,  beaucoup  de  séries  statistiques  sont  liées 
entre  elles  de  telle  façon  que  la  connexité  des  faits  ne  peut 
être  mise  en  doute;  sans  que  le  parallélisme  soit  parfait, 
la  tendance  générale  est  la  même  et  parfois,  pendant  plu- 
sieurs années,  les  courbes  se  rapprochent  du  parallélisme 
complet.  Dans  un  sens  opposé,  il  peut  y  avoir  entre  deux 
séries  opposition  absolue,  c'est-à-dire  qu'à  tout  mouvement 
ascensionnel  d'une  courbe  correspond  une  baisse  de  l'autre 
et  inversement.  Cet  antiparallélisme  trahit  encore  la  dépen- 
dance des  deux  faits  ;  ce  rapport,  si  les  deux  courbes  étaient 
rigoureusement  antiparallèles,  serait  aussi  étroit  que  si 
elles  étaient  absolument  parallèles,  car  il  suffirait  de  re- 


(1)  March  (L.'J,  «  Comparaison  numérique  des  courbes  statistiques  ». 
■{Journal  de  la  Société  de  Statistique  de  Paris,  1905,  p.  255.) 
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tourner  l'une  des  courbes  sur  elle-même  pour  qu'elle  s'ap- 
plique exactement  sur  la  seconde.  Ce  cas  d'opposition 
complète  est  tout  aussi  rare  que  le  précédent.  La  dépen- 
dance absolue  des  grandeurs  comparées  est  dite  positive 
quand  les  courbes  sont  parallèles,  elle  est  dite  négative 
dans  le  cas  contraire;  elle  a  l'unité  pour  expression  mathé- 
matique. 

Les  cas  d'accord  ou  de  désaccord  absolu  appartiennent 
au  domaine  de  la  théorie  plus  qu'à  celui  de  la  pratique. 
Dans  les  sciences  d'observation  et  surtout  dans  les  sciences 
sociales,  ils  sont  à  peu  près  inconnus.  Le  plus  souvent  on 
se  trouve  devant  des  séries  qui  accusent  une  dépendance 
partielle.  Il  n'est  pas  possible  d'arriver  à  quelque  exacti- 
tude par  la  simple  inspection  des  courbes.  L'observateur  le 
plus  attentif  doit  renoncer  à  exprimer,  à  la  simple  vue  d'un 
diagramme,  le  degré  de  dépendance  des  phénomènes  dont 
l'évolution  dans  le  temps  est  retracée  par  le  graphique.  A 
plus  forte  raison  est-il  impuissant  à  établir  des  compa- 
raisons entre  deux  graphiques  différents.  Aussi  a-t-il  fallu 
trouver  un  moyen  simple  de  traduire  en  une  donnée  numé- 
rique la  liaison  des  faits  considérés.  Un  premier  moyen  est 
la  recherche  de  ce  que  M.  March,  dans  son  travail  cité  plus 
haut,  a  appelé  l'indice  de  dépendance. 

312.  La  méthode  consiste  à  comparer  les  données  rela- 
tives à  chaque  année  aux  données  concernant  l'année  sui- 
vante en  affectant  du  signe  +  toute  variation  positive  et 
du  signe  ■ —  toute  variation  négative.  Si  aucune  variation 
ne  se  marque  d'une  année  à  l'autre,  on  inscrit  le  chiffre  0. 
Cette  première  partie  du  travail  étant  achevée,  on  fera  le 
produit  des  signes  relatifs  à  chacune  des  deux  séries  ;  ainsi, 
toute  double  variation  de  même  signe,  positif  ou  négatif, 
sera  inscrite  comme  variation  positive,  et  toute  double  va- 
riation de  signe  contraire  sera  considérée  comme  une  varia- 
tion négative.  Partant  de  ces  données,  on  évaluera  l'indice 
en  faisant  la  différence  des  signes  positifs  et  négatifs  et  en 
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divisant  cette  différence  par  la  somme  des  intervalles,  non 
compris  ceux  où  la  variation  est  nulle.  La  formule  de  l'in- 
dice de  dépendance  est  donc  : 

c  —  d  (53)' 
n 

» 

dans  laquelle  c  marque  le  nombre  de  variations  positives, 
d  celui  de  variations  négatives,  n  le  nombre  d'intervalles, 
On  peut  aussi  écrire  : 

c  —  d  (54) 

cfrf 

lorsque  les  deux  séries  ne  présentent  aucun  produit  nul. 

Comme  le  fait  observer  M.  March  (1),  une  discordance 
détruit  une  concordance.  Dans  toute  concordance,  les  deux 
variations  sont  de  même  signe,  et  le  produit  est  positif; 
dans  toute  discordance,  les  variations  sont  de  signe  opposé 
et  le  produit  est  négatif.  En  formant  la  somme  algébrique, 
les  produits  négatifs  se  retranchant  des  produits  positifs, 
les  discordances  annulent  en  quelque  sorte  automatiquement 
des  concordances  en  nombre  égal.  Le  dénominateur  est  une 
expression  positive  que  l'on  réduit,  pour  simplifier,  au 
nombre  des  intervalles. 

M.  March  a  fait  une  application  très  intéressante  de  cette 
méthode  à  la  comparaison  de  la  nuptialité  à  la  natalité  et 
au  sens  des  changements  annuels  de  divers  comptes  du 
bilan  de  la  Banque  de  France.  Nous  ferons  nous-même 
d'autres  applications  à  des  phénomènes  économiques  obser- 
vés en  Belgique. 

313.  Dans  un  travail  antérieur  auquel  nous  avons  déjà 
eu  l'occasion  de  nous  référer  (2)  nous  avons  essayé  de  ca- 


(1)  Maiîch  (L.  ),  «  Comparaison  numérique  des  courbes  statistiques  ». 
(Journal  de  la  Société  de  Statistique  de  Paris,  1905,  pp.  261-202.) 

(2)  Julin  (Arm.),  «  The  économie  progress  of  Belgium  ».  (Journal  of  the 
Royal  Statistic  Society,  London,  1910-11,  p.  251.) 
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ractériser  l'ampleur  de  certains  phénomènes  économiques 
m\  moyen  d'une  méthode  spéciale  d'index-numbers  que  l'on 
trouvera  décrite  en  détail  dans  le  mémoire  cité. 

Les  indices  concernant  la  production,  au  nombre  de  sept, 
se  rapportaient  à  la  production  des  mines  de  houille,  des 
carrières,  à  la  fabrication  du  fer  et  de  la  fonte,  à  la  fabri- 
cation de  l'acier,  à  celle  du  zinc,  du  plomb  et  de  l'argent, 
au  nombre  de  moteurs  à  vapeur  et  à  la  force,  en  chevaux- 
vapeur,  de  ces  moteurs.  L'expression  synthétique  de  ces 
indices,  de  1884  à  1908,  se  trouve  indiquée  dans  la  première 
colonne  du  tableau  suivant. 

Le  matériel  statistique  étant  plus  riche  en  ce  qui  con- 
cerne les  échanges,  nous  avons  pu  considérer  ici  quinze 
indices,  tels  que  les  importations  et  exportations  (com- 
merce spécial),  le  tonnage  de  la  navigation  maritime,  les 
transports  de  charbon  et  de  coke  par  canaux,  le  nombre  de 
voyageurs  sur  les  chemins  de  fer  de  l'Etat  et  des  compa- 
gnies, le  trafic  des  marchandises  par  voie  ferrée,  etc.  Le 
lecteur  trouvera  la  moyenne  de  ces  indices  à  la  seconde 
colonne  du  tableau  ci-après.  Calculant  ensuite  l'augmenta- 
tion ou  la  diminution  de  chaque  indice  synthétique  de  la 
première  année  à  la  seconde,  de  la  seconde  à  la  troisième 
et  ainsi  de  suite,  nous  avons  porté  ces  données  dans  les  co- 
lonnes 3  et  4  de  notre  tableau.  Le  sens  de  ces  variations, 
c'est-à-dire  leur  signe  positif  ou  négatif  est  indiqué  aux 
colonnes  5  et  6.  Enfin,  la  colonne  7  est  réservée  au  produit 
algébrique  des  signes,  et  les  signes  +  et  —  indiquent  que  la 
concordance  des  variations  est  positive  ou  négative.  En- 
suite, utilisant  la  formule 


puisque  aucun  produit  n'est  nul,  nous  avons  obtenu  une 
fraction  que  nous  avons  réduite,  pour  la  facilité  du  lecteur, 
•en  fraction  décimale. 
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D'après  ces  explications,  le  tableau  dont  il  s'agit  pré- 
sente les  résultats  suivants  : 


Exemple  1.  —  Variation  des  indices  de  la  production 
et  des  échanges  en  Belgique,  de  1884  à  1908. 


ANNEE 

Indice 
rie  la 
production 

Indice 
dt-s 
échanges 

ne  1  iudii'e 

oe  la 
production 

V  iXVi  ti  t  lOll 

de  1  indi-e 

des 
échanges 

vai  lalions 

de  la 
pro  uction 

^cijs  des 
varia'.ions 

des 
échanges 

Produit 

des 
signes 

1884 

100 

100 

7 

1 

4- 

+ 

1885 

93 

99 

1 

'   —1  ' 

4- 

1886 

92 

100 

—  8 

-  4 

4- 

1887 

100 

104 

—  5 

2 

+ 

1888 

105 

106 

10 

 .  4 

4- 

1889 

115 

110 

10 

-2  6 

-f- 

1890 

125 

1 16 

5 

4 

4- 

1 

1891 

120 

120 

3 

2 

+ 

-f- 

1892 

117 

118 

2 

1 

4- 

1893 

115 

119 

5 

3 

4- 

1894 

120 

122 

2 

3 

-j- 

1895 

122 

125 

19 

—  1 

■4- 

1896 

141 

126. 

9 

6 

-f- 

1897 

150 

132 

13 

9 

+ 

1898 

163 

141 

  23 

—  3 

-+- 

1899 

186 

144 

7 

5 

4- 

1900 

193 

149 

30 

2 

+ 



1901 

163 

151 

16 

5 

+ 

1902 

179 

156 

19 

6 

+ 

1903 

198 

162 

^-'13 

4 

+ 

1904 

211 

166 

10 

9 

+ 

1905 

221 

175 

26 

8 

+ 

1906 

247 

183 

12 

4 

+ 

3907 

259 

187 

38 

.6 

+ 

+ 

+ 

1908 

221 

181 
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Ainsi  que  nous  l'avons  dit  plus  haut,  la  concordance  ab- 
solue de  toutes  les  variations  aurait  pour  expression  numé- 
rique l'unité.  L'expression  obtenue  au  moyen  des  calculs 
qui  précèdent  est  0.66;  elle  signifie  donc  qu'il  y  a  entre  les 
échanges  et  la  production,  une  même  année,  une  dépendance 
marquée. 

314.  Il  peut  être  intéressant  de  rechercher  si  cette  dépen- 
dance est  aussi  accentuée  lorsque,  au  lieu  de  considérer  la 
même  année  de  part  et  d'autre,  on  fait  la  somme  algébrique 
des  signes  d'une  année  et  de  l'année  suivante;  par  exemple, 
les  échanges  en  1884  avec  la  production  en  1885,  et  ainsi  de 
suite.  On  remarquera  qu'alors  le  nombre  des  intervalles 
diminue  d'une  unité.  Le  lecteur  pourra  très  facilement 
faire  le  contrôle  du  calcul  en  se  servant  du  tableau  qui 
précède.  Le  résultat  numérique  de  cette  recherche  est  : 


c'est-à-dire  que  la  concordance  des  mouvements  est,  somme 
toute,  la  même  que  si  l'on  compare  les  données  de  la  même 
année,  et  qu'elle  reste  nettement  accusée. 

On  pourrait  aussi  se  demander  quels  seraient  les  résul- 
tats obtenus  si  l'on  considérait  le  rapport  de  la  production 
la  première  année  avec  les  échanges  la  seconde  année.  Le 
calcul  donne  : 


c'est-à-dire  un  indice  de  dépendance  inférieur  à  une  demi- 
unité,  sensiblement  moins  élevé  que  les  précédents.  On  peut 
en  conclure  que  les  échanges  augmentent  avant  la  produc- 
tion, c'est-à-dire  que  le  commerce  se  développe  d'abord  sous 
l'influence  d'une  demande  plus  forte  et  que  la  production 
suit  la  même  direction  pour  satisfaire  cette  demande.  On  a 


19  —  4 

23 


17  —  6  _  M 

23     ~"  23 


=  0,478 
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d'ailleurs  observé  depuis  longtemps  que  les  importations 
devancent  les  exportations  pendant  les  périodes  d'expan- 
sion commerciale. 

315.  La  méthode  résumée  ci-dessus  est  intéresante  en 
elle-même  et  elle  est  importante  à  raison  du  point  de  dé- 
part qu'elle  fournit  à  des  méthodes  plus  compliquées  que 
nous  analyserons  ensuite.  Ces  raisons  seront  suffisantes 
aux  yeux  du  lecteur  pour  justifier  une  seconde  application. 

Nous  en  trouvons  les  données  dans  la  statistique  an- 
nuelle dressée  par  l'administration  des  mines  en  Belgique. 
Depuis  1885,  cette  administration,  indépendamment  du  sa- 
laire moyen  général  des  ouvriers  de  charbonnages,  donne 
le  salaire  journalier  moyen  de  l'ouvrier  du  fond;  cette  der- 
nière valeur  est  plus  homogène  que  la  moyenne  générale  et 
par  conséquent,  elle  est  plus  représentative  ;  la  période  de 
1885  à  1915  est  d'ailleurs  suffisante  pour  apprécier  la  va- 
leur des  changements. 

D'autre  part,  le  bénéfice  moyen  à  la  tonne  est  indiqué 
dans  les  statistiques  des  mine»  depuis  de  longues  années. 
Existe-t-il  une  relation  entre  ces  deux  éléments?  Et  le  taux 
du  salaire  des  ouvriers  producteurs,  les  ouvriers  du  fond, 
marque-t-il  une  dépendance  quelconque  avec  le  profit 
moyen  à  la  tonne  réalisé  par  les  sociétés  charbonnières? 
Dans  le  but  d'apprécier  avec  exactitude  la  relation  exis- 
tante, on  emploiera  la  méthode  décrite  précédemment;  le 
tableau  ci-contre  donne  les-  résultats  du  calcul. 
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Exemple  2.  —  Bénéfice  à  la  tonne  et  salaire  journalier  moyen 
de  l'ouvrier  du  fond  dans  les  charbonnages  en  Belgique, 
de  1885  à  1915. 


ANNÉES 

Béaélice 
à  la 
touue 

Salaire 
journalier 

moyen 
de  l'ouvrier 

du  fond 

Variation 
du  bénéfice 
à  la 
toi. ne 

Variation 
du  salaire 
journalier 
moyeu 

Sens 
des 
variations, 
du  bénéfice 
à  la  tonne 

Sens  des 
vaiiutious 
du  salaire 
journalier 
moyen 

Produit 

des 
signes 

Francs 

Francs 

Francs 

Francs 

1885 

-0. 

40 

3. 

20 

0. 10 

0.26 

+ 

+ 

+ 

1886 

0 

30 

2 

94 

0.18 

0 

05 





+ 

1887 

0 

48 

2 

99 

0. 17 

0. 

11 

+ 

1888 

0 

65 

3 

10 

0.46 

0 

32 

+ 

1889 

1 

11 

3 

42 

1 .73 

0 

78 

+ 

1890 

2. 

84 

4 

20 

1 .02 

0 

02 

+ 

+ 

+ 

1891 

1 

82 

4 

18 

1 .22 

0 

62 

+ 

1892 

0 

60 

3 

56 

0.27 

0 

27 

+ 

+ 

+ 

lt-93 

0 

33 

3 

29 

0.07 

0 

04 

+ 

1894 

0 

40 

3. 

25 

0 

0 

18 

0 

0 

1895 

0 

40 

3. 

43 

0.12 

0 

06 

— 

+ 

1896 

0 

52 

3. 

49 

0.38 

0.23 

— 

+ 

1897 

0 

90 

3 

72 

0. 15 

0 

22 

— 

+ 

1898 

1 

05 

3 

94 

0.66 

0 

43 

4- 

1899 

1 

71 

4 

37 

2.55 

0 

84 

+ 

1900 

4 

26 

5 

21 

1 .93 

0.52 

-f 

1 

+ 

1901 

2 

33 

4 

69 

0.92 

0 

30 

+ 

+ 

+ 

1902 

1 

41 

4 

39 

0  18 

0.01 

+ 

+ 

+ 

1903 

1 

23 

4 

38 

0.48 

0 

18 

+ 

+ 

+ 

1904 

0 

75 

4 

20 

0.08 

0 

08 



+ 

1905 

0 

83 

4 

28 

1 .08 

0 

70 

+ 

1906 

1 

91 

4 

98 

0.25 

0 

54 

+ 

1907 

2 

16 

5 

52 

0.79 

0 

35 

-f- 

i 

1 

1908 

1 

37 

5 

17 

0.63 

0 

53 

+ 

+ 

+ 

1909 

0 

74 

4 

.64 

0.24 

0 

21 

+ 

1910 

0 

50 

4 

.85 

0.36 

0 

11 

+ 

1911 

0 

.14 

4 

.96 

0.20 

0 

38 

+ 

1912 

0 

.34 

5 

.34 

0.49 

0 

.42 

+ 

1913 

0 

.83 

5 

.76 

0.20 

0 

.58 

+ 

+ 

+ 

1914 

0 

.63 

5 

.18 

0  12 

0 

.67 

+ 

1915 

0 

.75 

4 

.51 
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Le  résultat  0.724  indique  qu'il  existe  une  dépendance 
marquée  entre  le  taux  des  salaires  des  ouvriers  du  fond  et 
le  bénéfice  à  la  tonne  réalisé  par  les  charbonnages. 

Cette  dépendance  se  traduit 'dans  l'année  même  où  le  bé- 
néfice est  réalisé,  car  si  l'on  unit  la  première  année,  pour 
les  bénéfices,  avec  la  seconde,  pour  les  salaires,  on  n'ob- 
tient qu'un  indice  de  dépendance  très  restreint  : 


Ces  exemples  suffisent  à  montrer  quels  sont  les  services 
que  l'indice  de  dépendance  est  capable  de  rendre  aux  cher- 
cheurs. L'indice  présente  l'avantage  d'une  grande  simpli- 
cité, mais  à  raison  de  ce  caractère  même  des  opérations, 
i]  manque  de  précision,  chose  que  le  lecteur  aura  déjà 
remarquée  avant  qu'on  ne  l'en  avertisse. 


III.  —  Coefficient  de  dépendance. 


316.  Pour  établir  l'indice  de  dépendance,  on  admet 
comme  postulat  initial  que  chaque  discordance  entre  les 
deux  valeurs  comparées  annule  une  concordance.  Bien  que 
l'indice  calculé  d'après  cette  base  donne  déjà  une  idée  ap- 
prochée de  la  relation  des  deux  courbes,  la  méthode  est  néan- 
moins exposée  à  un  grave  reproche  :  celui  de  ne  pas  tenir 
compte  de  l'ampleur  des  variations.  Une  légère  discordance 
est  tenue  pour  égale  à  une  forte  concordance;  il  y  a  dans 
cette  hypothèse  quelque  chose  de  contraire  à  la  réalité  et 
qui  nuit  à  l'exactitude  du  résultat.  C'est  pour  cette  raison 
que  Fechner,  après  avoir  indiqué  la  méthode  de  recherche 
de  l'indice,  a  proposé  ensuite  un  procédé  plus  parfait  connu 
sous  le  nom  de  coefficient  de  dépendance.  La  forme  la  plus 
simple  de  ce  coefficient  consiste  à  transformer  l'indice 
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simple  de  "dépendance  en  accouplant  par  voie  de  multipli- 
cation les  grandeurs  des  variations  comparées  qui  sont  de 
même  signe.  La  formule  est  identique  à  celle  de  l'indice 
simple,  sauf  que  les  lettres  minuscules  sont  remplacées  par 
des  majuscules  : 

_  C  —  I)  (55) 
C+  D 

Il  est  à  remarquer  que  la  formule  du  coefficient  de  dé- 
pendance proposée  par  Fechner,  porte,  tout  comme  l'indice 
de  dépendance,  sur  les  courbes  réelles  qui  résultent  des  ob- 
servations. Or,  ces  courbes  sont  difficilement  comparables, 
car  elles  résultent  d'unités  différentes.  C'est  pour  remé- 
dier à  cet  inconvénient  que  différents  auteurs  ont  proposé 
de  ramener  les  nombres  de  chaque  série  à  leur  valeur 
moyenne  ou  à  une  quantité  invariablement  liée  à  celle-ci; 
telle  est  la  quantité  qui  résulte  du  rapport  du  taux  de  cha- 
que année  au  taux  moyen.  La  formule,  dont  le  calcul  arith- 
métique exige  seulement  la  transformation  des  données  ori- 
ginales en  pour  cent,  est  de  la  forme  : 

txm  =  tm  (56) 

m 

dans  laquelle  t  représente  le  taux  initial  (valeur  correspon- 
dante à  l'année)  ;  m  la  moyenne  de  ces  valeurs;  tm  le  pour- 
î  centage  cherché. 

Faisons  application  de  cette  méthode  à  notre  exemple  2 
relatif  au  rapport  de  dépendance  entre  le  salaire  journa- 
lier moyen  de  l'ouvrier  du  fond  et  le  bénéfice  moyen  à  la 
tonne  réalisé  par  les  charbonnages  exploités  en  Belgique  de 
1885  à  1915. 

Dans  ce  but,  nous  établissons  le  tableau  suivant  (ex.  3) 
en  y  portant  les  données  énumérées  ci-après  : 

Après  avoir  inscrit  les  années  considérées  (1885-1915), 
nous  reproduisons  dans  la  colonne  2  les  données  relatives 
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au  bénéfice  moyen  à  la  tonne,  et  dans  la  colonne  3  celles 
concernant  le  salaire  de  l'ouvrier  du  fond;  nous  faisons  la 
moyenne  arithmétique  de  ces  valeurs  et  nous  l'inscrivons 
au  bas  de  la  colonne  correspondante;  comparant  ensuite 
les  valeurs  absolues  de  chaque  année  à  la  valeur  moyenne 
de  la  série,  d'après  la  formule  (56),  nous  écrivons  les  résul- 
tats du  calcul  dans  la  colonne  4  pour  le  bénéfice  à  la  tonne, 
dans  la  colonne  5  pour  le  salaire.  Les  colonnes  6  et  7  sont 
réservées  à  l'inscription  des  variations  de  ces  pourcentages 
de  chacune  des  deux  données,  en  procédant  comme  nous 
l'avons  fait  à  l'exemple  2,  de  la  première  année  à  la  se- 
conde, de  la  seconde  à  la  troisième  et  ainsi  de  suite. 

Dans  les  trois  colonnes  suivantes  (8,  9,  10)  on  note  les 
produits  des  variations  deux  à  deux  en  distinguant  les  pro- 
duits positifs,  négatifs  et  nuls  et  on  fait  la  somme  de  cha- 
cune de  ces  variations.  (Voir  tableau  ci-contre.) 
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Exemple  3.  —  Bénéfice  à  la  tonne  et  salaire  journalier  moyen  de 
l'ouvrier  du  fond  dans  les  charbonnages,  en  Belgique,  de  1885 
à  1915. 

Coefficient  I  de  dépendance. 


n 

d) 
o 

Bénéfice 
à  Ici 
lonue 

francs 

Salaire 
journalier 
moyen  <1 
ouvriers 

du  foi  ni 

francs 

Rapport  des  données 

annuelles  à  la 
moyenne  (pour  unité) 

Variations  annuellpt- 

Produits  d  s  variations 
la  même  année 

a 
a 
< 

Hé.éflce 
"/. 

Salaire 
0  0 

Bénéflce 
•/. 

Salaire 
•/. 

l'roduits 

.      i  .s 

Produits 
né^ati  fs 

Proiluits 

(2) 

(3) 

(4) 

(5 

(6) 

G) 

(8) 

(9) 

00) 

1885 

0  40 

3  20 

oi  on 
cl  àJ 

75.65 

1        Fi  OFi 
-j-     O  OO 

+  ,10  14 

ri)  •)•> 

D 

1886 

0.30 

2.94 

10  04 

i^O  Ki 

oy  ol 

—    !<  Oo 

—    1  34 

A  O  QO. 

k  oy 

1887 

0  48 

2.99 

25.57 

70.85 

—  y  py 

—   2  44 

OO    A  O 

ccAo 

» 

1888 

0.65 

3  10 

.34  /O 

"7Q  OO 

16  M 

O/.  £A 

—  44  DU 

—  (00 

loO  vo 

)> 

1889 

1  11 

3  42 

09.00 

oO  00 

no  r;o 
vc  OC 

—  18  44 

A  TflÊ!  A'7 

1  /Uo  U/ 

x> 

1890 

2.84 

4.20 

lOl  Ou 

no  oo 

yy  zy 

-j-  04  OO 

-|-  0  47 

OFC  Ci 

40.04 

» 

1891 

1  82 

4.18 

97  33 

OQ  QO 
y»  04 

-J-  00  44 

+•  14  66 

OE.C  AO 

>> 

1892 

0.60 

3  56 

Oï>  OO 

il  uy 

84  16 

-j-  14  44 

-f-  6  38 

GO  4.*> 

1893 

0  33 

3  29 

17  65 

77  78 

-    o  /4 

+  0  95 

3  55 

1894 

0.40 

3  25 

21 .39 

76  83 

u 

—    4  26 

Q 

1895 

0.40 

3  43 

21  39 

81  09 

—    D  42 

—    1  41 

O  A^ 

y  uo 

1896 

0  52 

3  49 

27  81 

82  50 

oa  oo 
-  4U  oc 

—    5  44 

Mil    Pi  £ 

11U  04 

)> 

1897 

0  90 

3.72 

48  13 

87  94 

fi  AO 

o  U4 

—    5  20 

M   "7  A 

41  ■  i\J 

* 

1898 

1.05 

3  94 

56  15 

93  14 

qk  on 
—  OO  o\) 

—  10  16 

OOO  00 

1899 

1  71 

4  37 

91  45 

103  30 

loO  oi 

—  20  08 

4 ioo  ol 

1900 

4.26 

5.21 

227  82 

123.38 

+103  22 

+  12  51 

1291  28 

» 

1901 

2.33 

4  69 

124  60 

110  87 

+  49  20 

+   7  09 

348  83 

» 

1902 

1  41 

4  39 

75  40 

103  78 

+  9  64 

+  0  23 

2  22 

iyiM 

1  23 

4  oo 

OO  10 

lUO  oo 

_|_  25  65 

-f-    4  <D 

1091  27 

1904 

0.75 

4.20 

40  11 

99.29 

-  4  28 

-    1  99 

8.52 

1905 

0  83 

4  28 

44  39 

101  28 

57.75 

—  16  45 

949  98 

» 

1906 

1  91 

4  98 

102  14 

117  73 

-  13  37 

-  12  77 

170  73 

» 

» 

1907 

216 

5  52 

115  51 

130.50 

+  42  25 

+  8  28 

349.83 

1908 

1.37 

5  17 

73  26 

122  22 

+  33  69 

+  12.52 

421.80 

» 

1909 

0  74 

4  64 

39  57 

109  70 

+  12  83 

-  4  97 

» 

63  77 

1910 

0  50 

4  85 

26  74 

114  67 

+  19  25 

-  2  60 

» 

50  05 

1911 

0  14 

4  96 

7  49 

117.27 

10  69 

-  8.97 

95  89 

» 

1912 

0  34 

5  34 

18.18 

126  24 

26  21 

-   9  94 

260.53 

» 

)> 

1913 

0  83 

5  76 

44.39 

136.18 

+  11.23 

+  13  71 

153  96 

» 

» 

1914 

0  63 

5  18 

33.16 

122  47 

-  6.95 

+  15.84 

» 

110.09 

1) 

1915 

0  75 

4.51 

40  11 

106  63 

» 

» 

» 

» 

» 

M  =  1.87 

M  =  4.23 

11,490.74 

227.46 

C  —  D  _  11,400.74  —  227.46 
~~ N  11,718.20 
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Dans  le  premier  cas  (indice  de  dépendance,  i)  nous  avons 
obtenu  le  nombre  de  variations  de  même  sens  entre  le  béné- 
fice à  la  tonne  réalisé  par  les  charbonnages  et  le  salaire 
journalier  moyen  attribué  aux  ouvriers  du  fond.  Nous  pou- 
vons conclure,  en  présence  des  résultats,  que  les  variations 
en  question  sont  souvent  concomitantes  :  sur  100  varia- 
tions, il  y  en  a  72  qui  sont  de  même  sens.  C'est  plus  qu'il 
n'en  faut  pour  pouvoir  affirmer  que  souvent  le  salaire 
augmente  quand  le  bénéfice  s'accroît. 

Mais  on  peut  se  yjoser  ^a  question  suivante  :  le 
salaire  augmente-t-il  dans  la  même  proportion  que  les  bé- 
néfices! Le  coefficient  de  dépendance  I  donné  par  la  for- 
mule (55)  (Cfr.  n°  314)  permet  de  dire  qu'il  en  est  presque 
toujours  ainsi  :  Le  lien  de  dépendance  entre  les  deux  phéno- 
mènes est  donc  bien  plus  accentué  qu'il  ne  paraissait  l'être 
par  le  simple  indice  i  :  en  effet,  l'union  qui  existe  entre  les 
proportions  des  variations  est  très  accentuée  si  nous  consi- 
dérons qu'il  est  marqué  par  une  expression  numérique  d'un 
ordre  élevé:  0.96.  Le  coefficient  I  a  donc  confirmé  et  pré- 
cisé celui  qui  précède. 

Ce  résultat  intéressant  est  à  noter  et  nous  passons 
ensuite  à  une  expression  différente,  l'expression  J, 
dans  laquelle  on  substitue  à  la  somme  des  valeurs 
absolues  des  produits  :  C  +  D  la  moitié  de  la  somme  des 
carrés  des  variations  comparées.  Le  but  de  cette  substitu- 
tion est  de  permettre  l'introduction  du  coefficient  de  cova- 
riation  dans  les  calculs  algébriques. 

317.  L'expression  J  peut  s'écrire  : 


Le  calcul  de  l'expression  Évvx,  somme  égale  à  C  —  D  est 
contenu  dans  les  colonnes  8  et  9  du  tableau  précédent 
(exemple  3).  Les  produits  positifs  égalent  -(-  11,490.74;  les 


C  —  I) 

S  i*_+  Ivj 
2 


,  ou  mieux 


V2  (Si* +  21^) 


(57) 
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produits  négatifs  valent  —  227.46.  Leur  somme  algébrique 
est  donc  égale  à  +  11,263.28,  valeur  qui  formera  le  numéra- 
teur de  la  fraction. 

Le  dénominateur  de  la  fraction  est  formé  de  la  moyenne 
des  sommes  des  carrés  des  deux  séries  de  variations  :  v  — 
les  variations  de  la  première,  v%  celles  de  la  seconde.  Les 
données  à  porter  au  carré  se  trouvent  inscrite»  dans  les  co- 
lonnes 6  et  7  du  tableau  dont  il  vient  d'être  parlé.  Nous 
avons  S  «2  =  58,242.22  et  S  v,2  =  5,133.97  dont  la  moyenne 
est:  31,688.09.  En  remplaçant  les  expressions  littérales  de 
la  formule  (57)  par  les  données  numériques  ci-dessus  indi- 
quées, nous  avons  : 

tvv,  11,263.28        ,n7n  . 

=  +  i/.îh  r**M  =  +  °-70  environ 


»/,  [£  v2  -fSv,2]  "     '  Vj  31,688.09 

Le  coefficient  est  égal  à  l'unité  lorsque  les  modifications 
que  subissent  les  deux  séries  dans  leur  évolution  chronolo- 
gique, sont  de  même  sens  et  égales;  il  diminue  progressi- 
vement dans  le  cas  contraire.  L'importance  du  coefficient  J 
est,  dans  l'espèce,  démontrée  par  le  fait  que  l'indice  de 
Feclmer,  en  outre  de  l'union  existant  entre  les  proportions 
de  variations,  atteignait  0.96,  tandis  que  J  marquait  0.70 
seulement.  C'est  que  les  variations  des  bénéfices  des  char- 
bonnages sont  beaucoup  plus  larges  que  celles  observées 
dans  les  salaires;  bien  que  le  salaire  de  l'ouvrier  du  fond 
soit  sensible  aux  variations  dans  les  bénéfices,  et  cela  la 
même  année,  les  modifications  qu'il  subit  sont  bien  moin- 
dres que  celles  du  profit  à  la  tonne. 

318.  Si,  au  dénominateur,  on  remplace  par  la  moyenne 
géométrique  la  moyenne  arithmétique  employée  pour  le  cal- 
cul du  coefficient  J,  on  obtient  un  coefficient  nouveau,  que 
M.  Mardi  a  appelé  coefficient  K  et  qui  est  de  la  forme  : 
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dans  laquelle  le  numérateur  représente  la  somme  des  pro- 
duits deux  à  deux  de  chacune  des  séries  et  le  dénominateur 
là  racine  carrée  du  produit  des  sommes  des  carrés. 

D'après  M.  March,  le  coefficient  K  semblerait  devoir 
être  préféré  au  coefficient  J.  Les  raisons  données  par  notre 
savant  collègue  sont  à  retenir.  Pour  passer  au  coefficient  K, 
on  change  les  unités  de  mesure  des  v  et  des  vx.  On  prend 
comme  unité  de  mesure  des  v,  \/Yô*  et  comme  unité  démesure 
des  Vi,  Remplaçant  dans  l'expression  de  J,  les  v  et 

vt  par  ces  nouvelles  expressions,  on  a  : 

V  Va 
S.  y   X  y—  

S/M] 

dans  laquelle  r  ==  1  quand  v  et  vx  sont  dans  un  rapport  con- 
stant, car  si  l'on  a  constamment  v  =  hv1 

_  VJc  Vi*  _  2  V  _ 

Lorsque  les  sommes  S  v2  et  s  fx2  ne  sont  pas  très  diffé- 
rentes, les  deux  coefficients  ne  s'écartent  pas  beaucoup  l'un 
de  l'autre.  Mais  à  mesure  que  les  sommes  S  v2  et  ï  se 
différencient,  <(  leur  moyenne  géométrique  s'écarte  de  plus 
en  plus  de  leur  moyenne  arithmétique,  dans  les  conditions 
où  une  parabole  s'écarte  de  sa  tangente  (1)  ».  Le  coeffi- 
cient K  tend,  dans  ce  cas,  vers  une  valeur  fixe,  moins  petite 
que  celle  du  coefficient  J.  En  prenant  une  valeur  très  ré- 
duite, J  exprime  bien  la  fixité  relative  d'une  série  par  rap- 
port à  l'autre,  ce  que  l'on  pourrait  à  première  vue  considé- 
rer comme  un  signe  d'indépendance;  mais  cet  aspect  des 
choses  n'est  pas  complet,  car  si  même  les  variations  d'une 
série  sont  très  petites,  par  rapport  aux  oscillations  de 
l'autre,  s'il  y  a  èntre  ces  changements  un  synchronisme 


(1)  March  (L.),  Cfr.  op.  cit.,  loc.  cit.,  p.  268. 
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parfait,  on  ne  pourra  s'empêcher  de  conclure  qu'un  lien 
étroit  de  dépendance  existe  entre  les  deux  phénomènes. 
L'exemple  3  convient  parfaitement  pour  l'application  du 
coefficient  K,  car  nous  avons  vu  que  1  v2  est  très  différent 
de  S  Vi2  et  que  J  n'a  qu'une  valeur  plus  faible,  tandis  que  I, 
qui  exprime  mieux  le  synchronisme  des  variations,  a  une 
valeur  élevée. 

Le  numérateur  de  la  fraction  d'où  se  tire  le  coefficient  K 
est  formé  de  la  somme  algébrique  des  variations  positives 
et  négatives  prises  deux  à  deux.  Les  données  numériques 
se  trouvent  inscrites  aux  colonnes  8  et  9  du  tableau  relatif 
à  l'exemple  3.  Quant  au  dénominateur,  il  est  formé  de  la  ra- 
cine carrée  du  produit  de  S  v2  et  2  v2  dont  la  valeur  numé- 
rique est  respectivement  58,242.22  X  5,133.97  ;  pour  simpli- 
fier les  calculs,  nous  supprimons  les  deux  décimales,  en 
forçant  le  dernier  chiffre  du  premier  de  ces  nombres. 

11.263  11.263 
|/^!xS^2     |/o8.242  xM34  17-292 

Le  coefficient  K  indique  par  conséquent  une  liaison  fort 
marquée  entre  les  deux  phénomènes  considérés  et  permet 
d'interpréter  définitivement  les  données  numériques  des 
séries.  En  nous  rapportant  à  l'indice  I  nous  voyons  que  la 
concomitance  des  hausses  et  des  baisses  se  présente  sou- 
vent; par  le  coefficient  J,  nous  constatons  que,  tandis  que 
l'une  des  séries  présente  de  grandes  oscillations,  la  seconde 
n'en  ressent  que  de  beaucoup  moindres;  enfin,  le  coeffi- 
cient K  rectifie  ce  qu'il  pourrait  y  avoir  d'erroné  dans 
nos  conclusions  basées  sur  I  et  sur  J,  en  nous  avertissant 
qu'à  un  mouvement  dans  la  première  série  correspond  sou- 
vent un  mouvement  dans  la  seconde  ;  bien  que  de  moindre 
ampleur,  le  mouvement  dont  il  s'agit  n'en  est  pas  moins 
un  indice  sérieux  de  la  liaison  existant  entre  les  deux  phé- 
nomènes. 
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Les  applications  qui  précèdent  montrent  clairement  l'in- 
térêt qui  s'attache  à  la  détermination  du  coefficient  de  dé- 
pendance; elles  n'exigent  pas,  en  général,  de  calculs  trop 
longs  ou  difficiles.  La  dernière  forme,  celle  du  coefficient 
K,  nous  conduit  directement  à  celle  que  les  Anglais  ont  ap- 
pelée coefficient  de  corrélation  et  qu'ils  désignent  sous  le 
symbole  r. 

IV.  —  Coefficient  de  covariation. 

(Coefficient  de  corrélation  (r  de  Pearson). 

319.  Pour  nous  accoutumer  à  l'idée  de  la  covariation, 
représentons-nous  mentalement  deux  courbes  chronolo- 
giques, de  telle  nature  qu'à  toute  variation  de  l'une  corres- 
ponde, au  même  moment,  une  variation  égale  de  l'autre. 
Ces  variations  peuvent  être  égales  comme  grandeurs  abso- 
lues ou  l 'être  seulement  comme  grandeurs  proportionnelles. 
Maintenant  que  le  lecteur  est  familier  avec  l'idée  de 
moyenne,  il  saisira  immédiatement  que  les  écarts  ou  dévia- 
tions autour  de  la  moyenne  de  chacune  de  ces  courbes  sont 
égaux  entre  eux;  représentons-nous  la  moyenne  par  une 
droite  tracée  à  travers  la  courbe;  d'après  l'hypothèse  qui 
précède,  nous  comprenons  fort  bien  que  tout  écart  au-des- 
sus ou  au-dessous  de  la  courbe  A  correspond  exactement  à 
un  écart  égal  au-dessus-  ou  au-dessous  de  la  courbe  B.  Dési- 
gnons par  x1}  x2,  x3...  xn  les  écarts  successifs  de  A  et  par  y1} 
y2,  y 3...  yn  les  écarts  de  B  ;  les  sommes  algébriques  des  xn  et 
des  yn  seront  égales  entre  elles  et  leur  produit  formera  la 
quantité  2  (%n  yn) .  D'autre  part,  le  produit  des  standard 
déviations  (o)  des  écarts,  multiplié  par  le  nombre  de  termes 
sera  égal  au  produit  -  (x„  yn)  de  sorte  que  le  coefficient  de 
covariation  s'exprimera  par  l'unité  : 

Le  coefficient  de  covariation  oscille  entre  les  deux  limites 


(1)  On  en  trouvera  la  démonstration  mathématique  dans  Bresciani  :  «  Sui 
metodi  per  la  misura  délie  correlazioni  (Giornale  clcgli  economisti, 
vol.  XXXV,  1909,  t.  I,  p.  492.  note)  et  dans  Bowi.ey,  Eléments  of  statistics. 
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0  et  1;  il  sera  donc  d'autant  plus  élevé  qu'il  se  rapprochera 
de  l'unité  et  d'autant  plus  faible  qu'il  s'en  écartera  davan- 
tage. Lorsque  le  coefficient  est  affecté  du  signe  +>  il  y  a 
corrélation  directe  entre  les  faits  envisagés  ;  accompagné 
du  signe  —  il  signifie  que  la  corrélation  entre  les  faits  est 
inverse. 

320.  Au  lieu  d'une  courbe,  envisageons  maintenant  les 
éléments  à  comparer  sous  la  forme  d'un  tableau  statistique. 
Disposons  les  variables  en  séries  en  les  groupant  comme 
dans  une  table  à  double  entrée.  Les  tables  de  cette  espèce 
contiennent  un  nombre  de  colonnes  égal  au  nombre  de 
classes  admises  pour  un  phénomène  donné,  en  fonction  d'un 
autre.  Elles  sont  très  fréquentes  en  statistique,  les  auteurs 
quLont  traité  de  la  covariation  en  donnent  de  nombreux 
exemples.  On  remarquera  qu'il  n'est  pas  nécessaire  que 
le  partage  par  classes  soit  identique,  pourvu  que  les  classes 
aient  un  intervalle  égal,  pour  chacune  des  deux  variables  ; 
néanmoins,  le  partage  par  classes  comprises  entre  les 
mêmes  limites  est  la  règle  habituelle,  comme  dans  l'exemple 
ci^âprès  dont  nous  tirons  les  éléments  de  la  «  Statistique  du 
mouvement  de  la  population  et  de  l'état  civil  en  Belgique 
en  1890  »  : 


Ex.  4       Ages  des  époux  au  moment  de  la  célébration  du  mariage. 


Ages 

Au  h  S  DES  Kl-.MMES 

DES  HoMMIS 

-  21 

21  -25 

25-30 

30-35 

35-40 

40-45 

45  -  50 

Total 

-  21 

774 

426 

128 

40 

26 

9 

1 

1,397 

21-25 

3,401 

6,086 

2,157 

409 

96 

39 

25 

12,213 

25  -  30 

2,073 

6,739 

5,720 

1,343 

382 

133 

49 

16,439 

30-35 

498 

1,669 

2,646 

1,601 

442 

180 

78 

7,114 

35-40 

140 

441 

838 

«52 

512 

221 

105 

3,109 

40-45 

40 

170 

344 

380 

291 

250 

133 

1,608 

45-50 

21 

54 

134 

195 

187 

208 

162 

961 

Totaux  . . . 

6,947 

15,585 

11,967 

4,820 

1,936 

1,033 

553 

42,841 
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Dans  l'exemple  qui  précède,  nous  avons  dû  négliger  les 
mariages  contractés  à  partir  de  50  ans,  parce  que  le  maté- 
riel statistique  dont  nous  disposions  ne  donne  que  le  nom- 
bre de  mariages  de  10  en  10  ans,  au  delà  de  50  ans,  de  telle 
sorte  que  les  intervalles  de  classes  n'auraient  pas  été  homo- 
gènes; ceci  est  un  nouvel  exemple  de  l'erreur  dans  laquelle 
on  tombe  fréquemment  en  ne  publiant  pas  les  données  sta- 
tistiques sous  une  forme  complète,  l'effet  de  cette  omis- 
sion est  de  mettre  obstacle  à  l'application  des  procédés  ma- 
thématiques. Néanmoins  le  tableau  même  limité  reste  très 
intéressant  et  très  démonstratif  puisqu'il  comprend  près  de 
43,000  mariages  sur  un  peu  plus  de  44,000. 

Le  tableau  qui  précède  réunit  les  éléments  nécessaires  à 
l'étude  des  relations  corrélatives  entre  l'âge  des  femmes  et 
celui  des  maris,  pour  les  mariages  contractés  en  1890,  en 
Belgique,  entre  des  personnes  âgées  de  moins  de  50  ans. 
Les  classes  d'âges  des  femmes  se  trouvent  inscrites  en  tète 
des  colonnes  verticales,  celles  des  hommes  sont  portées  à 
la  gauche  de  colonnes  horizontales,  que  nous  appellerons 
«  lignes  ))  pour  les  distinguer  des  premières.  Les  nombres 
qui  figurent  dans  le  corps  de  la  table  et  qui  constituent  cha- 
cun un  des  points  de  rencontre  d'une  colonne  verticale  avec 
une  ligne  horizontale  indiquent  pour  un  âge  donné  des 
femmes  et  pour  un  âge  donné  des  maris,  le  nombre  de 
couples  qui  ont  contracté  mariage  cette  année. 

La  colonne  verticale  2,  par  exemple,  nous  apprend  que 
parmi  les  femmes  de  21  à  moins  de  25  ans,  qui  se  sont  ma- 
riées en  1890  et  dont  le  nombre  total  s'élève  à  15,585,  6,739 
ont  épousé  des  hommes  d'un  âge  égal  au  leur  (dans  les 
limites  de  la  classe  21-25)  ;  170  ont  épousé  des  hommes  de 
40  à  moins  de  45  ans,  54  se  sont  mariées  à  des  hommes  de 
45  à  moins  de  50  ans.  La  première  «  ligne  »  horizontale 
nous  montre  que  sur  42,841  mariés,  1,397  étaient  âgés  de 
moins  de  21  ans  ;  le  plus  grand  nombre  ont  épousé  des  filles 
de  leur  âge,  mai»  quelques-uns  ont  pris  en  mariage  des 
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femmes  beaucoup  plus  âgées  qu'eux;  26,  par  exemple,  ont 
épousé  des  femmes  de  35  à  40  ans. 

Les  tables  de  corrélation  fournissent  ainsi  des  éléments 
très  curieux  utilisables  au  moyen  d'une  simple  lecture, 
mais  elles  ne  donnent  pas  la  réponse  précise  qui  est  à  re- 
chercher par  le  moyen  du  coefficient  de  corrélation.  D 'au- 
tre part,  les  tables  de  corrélation  supposent  qu'il  s'agit  de 
deux  variables  partagées  en  classes  de  fréquence.  Lorsque 
la  corrélation  à  rechercher  vise  des  séries  chronologiques 
composées  d'une  donnée  unique  par  année,  les  tables  de  cor- 
rélation ne  trouvent  pas  leur  application  ;  on  se  borne  dans 
ce  cas  à  confronter  les  deux  données  relatives  à  la  même 
année. 

321-  La  théorie  du  calcul  des  covariations  a  été  exposée 
avec  une  grande  habileté  par  les  statisticiens-mathémati- 
ciens anglais,  notamment  par  MM.  Karl  Pearson  et  Udny 
Yule.  Nous  essayerons  d'en  résumer  ci-après  l'essentiel  en 
donnant  à  notre  exposé  la  forme  la  plus  simple  et  la  plus 
accessible  aux  lecteurs  qui  ne  sont  pas  familiarisés  avec 
l'emploi  des  formules  mathématiques. 

La  théorie  des  covariations  est  basée  sur  la  pro- 
position suivante  :  lorsque  deux  variables  sont  abso- 
lument indépendantes,  les  distributions  de  fréquence 
dans  les  colonnes  verticales  et  les  lignes  horizontales 
d'une  table  de  contingences  sont  similaires  et  la  distri- 
bution dans  chaque  colonne  est  semblable  à  celle  de  la  co- 
lonne des  totaux  (1)  ;  si  l'on  attribue  à  chacune  de  ces  distri- 
butions un  axe  spécial,  X  ou  Y,  les  moyennes  des  séries 
doivent  se  trouver  sur  les  lignes  verticales  et  horizontales 
Mi  M;  M,  M,  comme  dans  la  figure  26  (2)  : 

Dans   le  diagramme  ci-après   OX   et   OY   sont  les 

(1)  Pour  la  démonstration  de  cette  propriété,  cfr.  Udny  Yule,  «  An  intro- 
duction to  the  theory  of  statistica  »,  ch.  V  (Manifold  classification). 

(2)  Nous  adoptons  comme  base  de  la  démonstration  la  figure  employée  par 
Udny  Yule,  loc.  cit.,  ch.  IX  (corrélation),  p.  168,  et  nous  employons  la 
notation  de  notre  éminent  collègue. 
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FlG.  26 


échelles  des  deux  variables  ;  M:  est  donc  la  moyenne  de  la 
valeur  de  X  et  M2  la  moyenne  de  la  valeur  de  Y;  en  d'au- 
M  très  termes,  M1  est  la  moyenne  de  la  va- 

leur des  abscisses  et  M2  celle  des  ordon- 
nées. La  figure  26  est  le  type  théorique  de 
représentation  de  deux  variables  dans 
l'éventualité  d'une  indépendance  absolue 
de  ces  deux  variables.  Dans  la  pratique 
ce  cas  ne  se  rencontre  pas,  parce  que  l'ab- 
sence de  tout  rapport  de  dépendance  n'est 
jamais  absolument  complète.  Quoi  qu'il  en 
soit,  cette  conception  purement  idéale  d'une  indépen- 
dance absolue  des  variables  a  son  utilité  en  ce  sens 
qu'elle  sert  de  base  de  comparaison  dans  le  calcul  des 
relations  corrélatives  qui  se  manifestent  entre  les  deux 
variables  considérées. 

En  effet,  hors  le  cas  d'indépendance  absolue,  les  distri- 
butions de  fréquence  ne  sont  plus  similaires  et  les 
moyennes  des  séries  ne  tombent  plus  en  M!  M  et  M2  M, 
mais  déterminent  des  courbes  qui  s'écartent  plus  ou  moins 
de  ces  points.  Or,  ce  sont  les  écarts  constatés  entre  les  posi- 
tions théoriques  et  les  positions  réelles  des  variables  qui 
sont  à  calculer  en  vue  de  la  recherche  du  degré  de  covaria- 
tion  entre  les  phénomènes  observés. 

Partant  de  cette  consi- 
dération, si,  conformément 
au  dispositif  de  la  figure  27 
ci-contre,  nous  convenons 
de  représenter  dans  les 
quadrants  2  et  4  les  oscil- 
lations de  Mx  y  et  M2  x, 
nous  pouvons  admettre  que 
ces  points  occupent  une 
infinité  de  positions  com- 
prises entre  les  limites  de 
ces  quadrants. 


Fig  .  27 


COVAHIATION 


51  f 


Au  plus  la  somme  des  écarts  sera  grande  et  au  plus  Le 
degré  de  covariation  entre  les  deux  phénomènes  sera  élevé. 
Il  deviendra  parfait  lorsque  M',  y  '  se  confondra  avec  M  \  x\ 
Dans  ce  cas,  la  somme  des  écarts  sera  maximum  et  sa  va- 
leur vaudra  90°  parce  que  les  arcs  des  angles  %'  M  y  et 
y'  M  x  seront  alors  complémentaires. 

Il  résulte  de  ce  qui  précède  que  lorsque  la  somme  des 
écarts  est  égale  à  zéro,  il  y  a  indépendance  absolue  entre  les 
deux  variables  et  que  lorsque  cette  somme  est  maximum,  la 
corrélation  est  parfaite  entre  les  deux  phénomènes;  toute 
position  intermédiaire  détermine  un  degré  de  corrélation 
plus  ou  moins  affirmé. 


322.  Ceci  établi,  il 
reste  à  voir  com- 
ment se  calculent  les 
écarts  formés  par  les 
oscillations  de  M\  y' 
et  M'2  0}'  à  partir  de 
Mj  y  et  de  M2  x. 

A  cette  fin,  il 
y  a  notamment  lieu 
de  démontrer  que 
quel  que  soit  l'as- 
pect sous  lequel  se 
présente  la  distri- 
bution de  fréquence 
des  deux  variables,  le  point  M  déterminé  par  l'in- 
tersection de  Ma  y  et  de  M.  x  est  le  lieu  géométrique  de  la 
moyenne  de  la  distribution  totale  des  fréquences  des  deux 
variables  à  la  fois. 

Mais  avant  d'aborder  cette  démonstration  il  est  utile  et 
même  nécessaire  d'étudier  la  genèse  et  la  nature  des  équa- 
tions qui  forment  la  base  du  raisonnement. 

Considérons  la  figure  28  ci-dessus  : 


Fig.  28. 
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Lorsque  R  E  forme  avec  l'axe  vertical  Ma  y  un  angle  de 
45°  nous  avons  : 

Kl  =  /M, 

Kl 

d'où  —,  rapport  que  M.  Udny  Yule  désigne  par  bx  =  1. 

Si  nous  représentons  par  x  et  par  y  les  écarts  à  partir 
de  Mi  y  et  de  M2  x,  il  suit  de  ce  qui  précède  que  x  =  y  et  que 
le  nombre  de  déviations  en  x  est  égal  au  nombre  des  obser- 
vations du  type  y  multiplié  par  b1,  ce  qui  donne  : 

2  (x)  =  nb,y  (59) 

égalité  qui  se  vérifie  pour  toutes  les-  positions  de  R  R,  ainsi 
que  le  montre  l'analyse  des  cas  suivants  : 

Premier  cas.  —  Si  nous  faisons  tourner  R  R  dans  le  sens 
A  l,  il  arrivera  un  moment  où  R  R  se  trouvera  en  R'  R' 

et  bx  aura  alors  pour  valeur  ^  ou  1/2.  Les  déviations  en  x 

n'ont  pas  changé,  mais  les  écarts  ont  été  multipliés  par  2. 
Il  viendrait  donc  d'après  la  formule  (59)  : 

nb^2y 
S  (*)  =  — 2  — 

et,  en  simplifiant,  il  vient  comme  dans  la  formule  (59)  : 

S  (x)  =  nbly 

Généralisant  la  formule  et  désignant  par  p  toute  posi- 
tion quelconque  de  R  R  comprise  entre  les  angles  s  et  z  (la 
position  R"  R"  par  exemple  dans  la  figure  28),  il  vient  : 

S  (x)  =  — 

P 

ou  en  simplifiant  : 

1  (x)  —  n  bi  y  v 
ce  qui  vérifie  la  formule  indiquée  plus  haut. 
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Deuxième  cas.  —  On  obtiendrait  le  même  résultat  en  con- 
sidérant là  valeur  de  l'écart  x  dans  sa  position  initiale  E  F. 

h  •  % 

Dans  ce  cas,  lorsque  R  R  coupe  bt  en  -1  l'écart  x  devient  '-  et 

m 

l'écart  y  tombe  en  y*  (Cfr.  fig.  28).  La  formule  se  présenter 
alors  comme  suit: 

2  (x)      n  bi  y 


2 


2 


ou 


ï  x  =  n  bx  î/' 

ce  qui  vérifie  la  formule  pour  le  deuxième  cas. 


Fig.  29. 


Troisième  cas.  —  Pour  toutes  les  positions  de  R  R  dans 
les  limites  des  angles  s  et  z  (Cfr.  fig.  28),  le  rapport 
K 

— ■  varie  de  0  à  1. 
IM 

Pour  toutes  les  positions  de  R  R  dans  les  limites  des  an- 

K  l 

H'ies  T  et  U  (voir  fig.  29)  le  rapport  —  varie  de  1  à  x. 

IM 

Kl  Kl 

Lorsque  —  >  1  soit  —  =  p  &j,  la  formule  générale  devient  : 
/M  IM. 

p  S  (x)  =  n  p  6j  y 
d 'où  par  simplification  : 

ï  (x)  =  nbxy 


33 
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En  considérant  l'écart  y  dans  sa  position  d'origine  E  F 
et  en  supposant  que  R  R  coupe  &!  en  2  &x  l'écart  y  devient  - 
et  la  formule  se  représente  alors  sous  la  forme 

S  (x)  =  7llAl  ou  Z(x)  =  nbiy 

Si,  comme  dans  la  figure  29,  R'  R'  a  une  autre  valeur  que 
^,  soit  p,  on  se  trouve  dans  le  cas  de  la  formule  générale. 

M 

323.  Les  considérations  qui  précèdent  concernant  les 

K  / 

trois  cas  relatifs  aux  valeurs  de  — ,  nous  fournissent  les 

/  M 

éléments  nécessaires  à  la  compréhension  complète  de  la  dé- 
monstration du  théorème  initial. 

Soit  la  figure  ci-dessous  : 


Fig.  30. 

Considérons  le  cas  dans  lequel  les  moyennes  des  colonnes 
horizontales  de  la  table  de  covariation  ou  de  contingence 
tombent  exactement  sur  une  droite  R  R.  Soit  M2  la  valeur 
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moyenne  de  Y  et  R  R  coupant  l'horizontale  M2  x  au  point 
M.  Il  y  a  lieu  de  démontrer  que  la  verticale  M,  y  qui  coupe 
M2  x  en  M  doit  couper  0  X  en  M,  moyenne  de  l'axe  des  X. 
Soit  l'inclinaison  de  R  R  sur  Mj  y  exprimée  par  la  tan- 

K  / 

gente  de  l'angle  Mi  M  R  ou  le  rapport  — -  ,  désigné  par  blf 

et  soient  x  et  y  les  déviations  à  partir  de  M  y  et  de  M  x. 

Pour  chaque  colonne  horizontale  du  type  y,  pour  lequel 
le  nombre  d'observations  est  n,  il  vient  1  (x)  —  n  &i  y.  Par 
conséquent,  pour  toute  la  table,  puisque  s  (n  y)  =  0,  il 
viendra  :  S  (x)  =  b1}  2  (n  y)  =  0.  Mi  doit  donc  être  la 
moyenne  de  x  et  M  devient  la  moj'enne  de  toute  la  distribu- 
tion. 

Sachant  que  RR  passe  en  Mx  il  reste  à  déterminer  b±. 
Cette  détermination  comme  le  dit  M.  Udny  Yule,  peut  s'éta- 
blir dans  les  termes  du  produit  moyen  p  de  tous  les  couples 
de  déviation  associés  x  et  y. 

L'expression  du  produit  moyen  p,  d'après  la  notation 
d'usage,  s'écrit  comme  suit  : 

i 

P  =  n  S  (*»)  (60) 

ce  qui  donne  pour  chaque  colonne  horizontale  : 
S  (xii)  =  y2(x)=nb1y*  (') 
Pour  toute  la  table,  il  viendra  : 

ï(xy)  -.M  (»*»•)  =  Nb.al 

Il  s'agit  d'obtenir  la  valeur  de  b{  a-y. 
D'après  la  formule  ci-dessus,  nous  avons  : 

,     S  (x  u) 
N  v 


(1)  Nous  avons  vu  que  v  (x)  =  n  b{  y.  En  remplaçant  v  (œ)  par  sa  valeur,  nous 
avons  :  y  n  b,  y  —  nb{  y*.  Donc  .1/  X  (.-»)  =  n  y%. 
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En  remplaçant  par  p  le  second  membre  de  l'équation, 
nous  aurons  : 

bl  al  =  v 

Enfin,  en  tirant  la  valeur  de  61  dans  la  formule,  il  vien- 
dra : 

h  -  t- 

1  ~  ff{  (61) 

?"  S 

De  même  b>,  c'est-à-dire  le  rapport  — -    (Cfr-  fig.  30) 

s  M 

mesurant  les  écarts  en  C  C  serait  déterminé  comme  suit  : 

(62) 


b.  =  A 


Il  est  d'usage  d'écrire  ces  deux  équations  en  se  servant 
d'une  notation  quelque  peu  différente.  Voici  cette  expres- 
sion : 

ox  o;/  (63) 

324.  Dès  lors  pour  retrouver  la  valeur  de  bt>  en  considé- 
rant la  formule  précédente,  il  suffit  de  faire  subir  à  celle-ci 
les  transformations  suivantes  : 

Nous  avons  vu  que  p  =  &x  <j,) .  Par  conséquent,  en  rem- 
plaçant p  par  sa  valeur  dans  l'équation  (63),  nous  obtien- 
drons : 

,.     bt  ol 

a~o~  (64) 

X  y 


En  isolant  blf  la  formule  se  transforme  comme  suit 


COVARIATION 


517 


Simplifiant  la  fraction  de  la  formule,  il  vient 


d'où  : 


=  r£  (65) 


On  trouverait  de  même  la  valeur  de  b2 

cr, 


bi  =  r 


a  (66) 


De  ce  qui  précède,  on  peut  déduire  aisément  que  l'expres- 
sion du  coefficient  de  covariation  est  de  la  forme  : 


r  =  p 

o,ov  (67) 


En  effet,  r  est  fonction  de  bx  et  de  b2  en  ce  sens  que  quand 
ces  deux  variables  sont  absolument  indépendantes  et  égales 
à  0,  r  =  0. 

Or,  nous  avons  pu  remarquer  en  recherchant  la  formule 
de  détermination  de  &j  et  de  b2  que  bi  et  b2  sont  des  valeurs 
implicitement  comprises  dans  le  second  membre  de  l'équa- 
tion : 

v 

X  V 

Notons  également  que  le  signe  de  r  est  celui  du  produit 
moyen  p  et  que  par  conséquent  r  est  positif  lorsqu'à  de 
grandes  valeurs  de  x  correspondent  de  grandes  valeurs  de 
y  et  qu'il  est  négatif  dans  le  cas  opposé. 

Enfin,  la  valeur  numérique  de  r  a  pour  limites  ±  1.  Si 
r  =  ±  1,  il  s'ensuit  que  toutes  les  variations  accouplées 

r 

sont  entre  elles  dans  le  rapport  = 

y  a> 
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Ces  diverses  propriétés  de  r  se  vérifiant  toutes  par 
l'équation  de  la  forme 

r  =  p/a.,-  a,j, 

,  nous  pouvons  conclure  que  l'équation  précitée  est  l'expres- 
sion du  degré  des  rapports  de  covariation  entre  deux  va- 
riables et  que  r  est  le  coefficient  de  covariation  de  deux 
variables  données. 

325.  Pour  le  calcul  numérique  du  coefficient  r,  trois  cas 
sont  à  envisager  : 

A.  —  Les  deux  variables,  disposées  dans  l'ordre  chrono- 
logique, sont  comparées  entre  elles  de  façon  à  saisir  la  rela- 
tion qu'elles  présentent  sur  toute  l'étendue  de  temps  con- 
sidérée. 

B.  —  Au  lieu  d'envisager  uniquement  cette  relation,  on 
étudie  et  on  compare  les  variables  de  façon  à  mettre  en  évi- 
dence les  variations  portant  sur  une  période  de  temps  assez 
courte;  il  est  évident  que  le  rapport  de  deux  faits  l'un  à 
l 'autre  peut  être  différent  quand  il  s 'applique  à  un  nombre 
d'années  restreint  et  quand  il  concerne  des  variations  sé- 
culaires. 

C.  —  Le  coefficient  r  appliqué  à  des  variables  groupées 
par  classe  ne  se  peut  calculer  de  la  même  manière  que  pour 
des  séries  chronologiques.  Une  méthode  spéciale  s'impose 
pour  une  telle  recherche. 

Nous  examinerons  successivement  ces  trois  cas  auxquels 
correspond  respectivement  une  méthode  particulière  et 
nous  donnerons  chaque  fois  un  ou  plusieurs  exemples  ap- 
propriés. Les  calculs  à  effectuer,  quoique  assez  laborieux, 
n'offrent  point  de  difficultés  spéciales.  Quant  à  la  for- 
mule générale  du  coefficient  r,  elle  ne  subit  pas  de  modifica- 
tion essentielle  :  dans  le  cas  B,  la  moyenne  générale  est 
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remplacée  par  une  moyenne  plus  courte  et  les  écarts  se 
notent  de  la  donnée  primitive  à  la  donnée  nouvelle  ;  dans  le 
cas  C,  la  recherche  de  l'intervalle  de  classe  joue  un  rôle 
important  et  la  recherche  des  écarts  se  fait  à  l'aide  d'un 
tableau  spécial.  Ces  particularités  n'altèrent  point  la  for- 
mule générale,  que  l'on  écrit  : 

naxav  (68) 

dans  laquelle  r  désigne  le  coefficient  cherché,  1  (x  y)  la 
somme  algébrique  des  produits  des  écarts  à  la  moyenne, 
n  le  nombre  d'intervalles  ou  de  termes,  ax  la  standard  dé- 
viation de  la  première  variable  et  ,  a,,  la  standard  déviation 
de  la  seconde  variable. 

En  représentant  par  P  la  moyenne  de  la  somme  des  pro- 
duits des  écarts,  la  formule  devient  : 

P 

~~  <*m  ®y  (69; 

d'où  il  suit  que  le  coefficient  r  est  égal  au  quotient  de  la 
moyenne  de  la  somme  des  produits  des  écarts  par  le  pro- 
duit des  racines  carrées  de  la  moyenne  des  écarts  des  va- 
riables x  et  y  et  nous  pouvons  poser  : 

P     =  (70) 

Le  coefficient  r  est  appliqué  au  calcul  des  variations  de 
deux,  de  trois  ou  d'un  plus  grand  nombre  de  variables. 
Nous  envisagerons  uniquement  à  cet  endroit  le  cas  de  deux 
variables  corrélatives,  un  paragraphe  spécial  sera  réservé 
à  l'examen  et  à  l'application  des  méthodes  lorsque  trois 
variables  sont  considérées  en  même  temps.  Quant  à  l'étude 
des  variables  en  plus  grand  nombre  que  trois,  nous  la  pas- 
serons sous  silence  et  nous  renverrons  le  lecteur  aux  ou- 
vrages des  auteurs  qui  ont  exposé  ce  point  :  nous  avons 
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pris  cette  résolution  à  cause  de  la  complication  des  mé- 
thodes quand  il  s'agit  de  plus  de  trois  variables  et  parce 
que  nous  partageons  l'avis  de  M.  L.  March  qui  pense  que 
l'étude  de  la  corrélation  à  deux  variables  est  surtout  celle 
qui  doit  retenir  l'attention  étant  à  peu  près  la  seule  qui  ait 
été  véritablement  féconde  (1). 

326.  Sous  ce  numéro  nous  étudierons  l'application  du 
coefficient  r  exclusivement  à  deux  variables  disposées  selon 
l'ordre  chronologique  (cas  A).  (Cfr.  n°  318.) 

Un  premier  exemple  nous  est  fourni  par  le  tableau  des 
lectures  hebdomadaires  de  deux  thermomètres  souterrains 
tt  et  t2  faites  à  l'observatoire  d'Edimbourg  et  rapportées 
par  M.  Thomas  Heath,  astronome  adjoint  à  cette  Institu- 
tion. 

Dans  la  première  colonne  du  tableau  nous  portons  les 
dates  des  observations  faites;  pour  la  facilité  du  lecteur 
nous  nous  sommes  borné  aux  trois  premiers  mois  de  l'an- 
née (1899)  ;  les  colonnes  2  et  3  sont  réservées  à  l'inscription 
des  indications  des  thermomètres  relevées  chaque  semaine, 
à  la  date  en  regard.  La  moyenne  arithmétique  simple  de  ces 
données  est  inscrite  au  bas  de  la  colonne.  Les  colonnes  4  et 
5  contiennent  les  écarts,  avec  leur  signe,  de  chaque  observa- 
tion à  la  moyenne;  sous  les  numéros  6  et  7  on  trouve  les 
carrés  de  ces  écarts;  enfin,  la  colonne  8  donne  le  produit 
des  écarts  entre  eux,  avec  leur  signe.  On  fait  la  somme  des 
x2  et  des  y2,  on  en  prend  la  moyenne  et  on  en  extrait  la  ra- 
cine carrée.  Le  numérateur  de  la  fraction  est  le  produit 
Sx  y;  on  ne  doit  pas  oublier  qu'il  s'agit  d'une  somme  algé- 
brique. Le  dénominateur  se  compose  du  produit  du  nombre 
d'observations  par  ax  et  ay. 


(1)  March  (L.),  «  Essai  sur  un  mode  d'exposer  les  principaux  éléments 
de  la  théorie  statistique  ».  (Journal  de  la  Société  de  Statistique  de  Paris, 
1910,  p.  485.) 
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En  se  reportant  au  tableau  suivant,  le  lecteur  suivra  avec 
la  plus  grande  facilité  la  marche  des  calculs.  Le  résultat  est 
positif  et  est  égal  à  r  =  0,984,  c'est-à-dire  qu'entre  les  indi- 
cations fournies  par  les  thermomètres  t1  et  t2  il  y  a  une  cor- 
rélation très  étroite  qui  s'exprime  par  une  donnée  proche 
de  l'unité. 

Exemple  5. 


Variations  de  deux  thermomètres  souterrains  à  Edimbourg. 

(Matériel  extrait  des  Trans.  Roy.  Soc.  of  Edinburgh,  t.  40,  1900-1901,  pp.  169-170,  tab.  I.) 

Coefficient  de  Pearson  (r) 


Lectures  hebdomadaire  » 

Écarts 

DATES 

des 

thermomètres 

à  la  moyenne 
de 

às« 

y* 

xy 

(1899) 

h 

H  (*) 

h 

2/1 

(il 

(3) 

(i 

& 

(6) 

(7) 

(Si 

I  il  II  XTl  HT* 

47 

.50 

46 

.90 

+0  39 

+  1 

54 

o 

«     9  .  . 

47 

49 

46 

.72 

+0  3> 

+  1 

.36 

0 

144-1 

1.8496 

4  0.5168 

»    16  .  . 

47 

43 

46 

42 

+0.32 

+  1 

.06 

0 

1024 

1. 1236 

+0.3392 

»    23  .  . 

47 

3  i 

46 

12 

+0.25 

+0 

76 

0 

0625 

0.5776 

+0.1900 

-    30  .  . 

47 

32 

45 

83 

+0.21 

+0 

47 

0 

0441 

0.2209 

+0.0987 

Février  6  .  . 

47 

2-> 

45 

52 

+0.11 

+0 

16 

0 

0121 

0.0256 

+0.0176 

»    13  .  . 

47 

17 

45 

19 

+0.06 

— 0 

17 

0 

00.<6 

0.0289 

—0.0102- 

»    20  .  . 

47 

08 

44 

86 

— o.o< 

-0 

50 

0 

0009 

0.2500 

+0.0150 

-    27  .  . 

46 

97 

44 

68 

—0.14 

— 0 

68 

0 

0196 

0.4624 

+0.0952 

Mars     6  .  . 

46 

88 

44 

54 

—0.23 

-0 

82 

0 

0ô->9 

0.6724 

+0. 1886 

»    13  .  . 

46 

79 

44 

41 

—0.32 

-0 

95 

0 

1024 

0.902.". 

+0.3040 

«    20  .  . 

46 

65 

44 

26 

—0  46 

—1 

10 

0 

2116 

1 .2100 

+  0.5060 

»    27  .  . 

46 

58 

44. 

25 

—0.53 

-1 

11 

0 

28i  9 

1.2321 

+0.5883 

M=47. 

11 

M=45.36 

1. 

1895 

10.327:.' 

v  3.4498 

2(xy)  3.4498 
r  -  £BÔ46  =  +  0-984. 
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327.  L'exemple  qui  suit  est  emprunté  au  matériel  que 
nous  avons  réuni  et  travaillé  dans  notre  étude  sur  «  Les  pro^ 
grès  économiques  de  la  Belgique,  de  1880  à  1908  »  parue  en 
1911  dans  le  Journal  de  la  Société  royale  de  statistique  de 
Londres.  Nous  avons  comparé  entre  eux  les-  indices  de  la 
production  et  les  indices  des  échanges;  à  l'aide  du  même 
matériel  nous  avons  déjà  déterminé  le  résultat  donné  par 

la  comparaison  des  courbes  à  l'aide  de  la  formule  ^—^(54). 

(Cfr.  n"  313.)  Maintenant  nous  allons  procéder  à  un  calcul 
plus  complet  et  plus  précis  en  recherchant  le  coefficient  de 
covariation  pour  la  série  entière.  La  première  colonne  du 
tableau  est  réservée  à  l'inscription  des  années  couvertes 
par  l'observation.  Les  indices  de  la  production  et  des 
échanges  figurent  aux  colonnes  2  et  5  ;  on  remarquera  que 
ces  données  sont  des  valeurs  proportionnelles  empruntées 
à  un  système  d 'Index-numbers  ;  le  coefficient  de  covaria- 
tion se  calcule  de  la  même  manière  pour  les  données  pro- 
portionnelles et  pour  les  nombres  absolus.  La  moyenne  des 
indices  est  ensuite  calculée  :  pour  la  production,  nous  la 
4C)78 

trouvons  égale  à  -~  =  147.  51,  chiffre  que  nous  arrondis- 

sons  à  148  pour  la  f  acilité  du  calcul  les  indices  des  échanges 
3788 

ont  pour  moyenne  — -   =  130.62  que  nous  écrivons  131, 

afin  de  réduire  le  travail  arithmétique.  Les  colonnes  3  et  6 
reçoivent  les  valeurs  des  écarts,  qui  sont  portées  au  carré 
aux  colonnes  4  et  7  et  multipliées  entre  elles  à  la  colonne  8. 

Ces  éléments  étant  ainsi  calculés  et  disposés,  on  procède 
comme  précédemment  et  l'on  trouve  que  le  coefficient  de 
covariation  entre  les  indices  de  la  production  et  des 
échanges  est  très  élevé  (0,979)  (1)  indiquant  une  union  in- 
time entre  les  deux  phénomènes. 


(1)  Le  professeur  Mortara,  qui  a  calculé  la  même  donnée,  a  obtenu  le  même 
résultat  à  un  millième  près,  en  moins. 
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Exemple  6. 


Indices  de  la  production  et  des  échanges  en  Belgique, 
de  1880  à  1908. 


ANNÉES 

PRODUCTION 

ÉCHANGES 

oc  y 

Iuder 
de  la 
production 

v  armt  ions 
par  'api  oit 
à  la 
moyenne 

(X) 

Index 
des 
échanges 

V  'i  r  i  ;i  t  i  on  H 

par  i  apport 
à  la 
mojeuue 

(y) 

y* 

U) 

(?) 

(3) 

14) 

15) 

(6) 

(") 

1880 

102 

QQ 

QQ 
—  .>) 

111QQ 

+  1518 

1881 

102 

911  fi 

98 

QQ 

!UoÏ7 

+  1518 

1882 

110 

 3g 

1  kkk 

1444 

QQ 
u.~ 

Q9 

1U44 

+  1216 

1883 

108 

  i(\ 

1  fîftfl 

iomi 

ini 

lui 

'!A 
—  uU 

+  1200 

1884 

100 

  43 

230A 

100 

—  i  )  ) 

901 

f  1488 

1885 

93 

—  55 

3025 

99 

  32 

1024 

+  1760 

188(5 

92 

—  56 

3136 

100 

  31 

961 

+  1736 

1887 

100 

—  48 

2304 

104 

 27 

729 

+  1296 

1888 

105 

—  43 

1849 

106 

—  25 

625 

+  1075 

1889 

115 

—  33 

1089 

110 

—  21 

441 

•  +  693 

1890 

125 

—  23 
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116 

—  15 

225 

+  345 

1891 

120 

—  28 

784 

120 

—  11 

121 

+  308 

1892 

117 

—  31 

961 

118 

—  13 

169 

+  403 

1893 

115 

—  33 

1089 

119 

  12 

14  i 

+  396 

1894 

120 

—  28 

784 

122 

  9 

81 

+  252 

1895 

122 

-  26 

676 

125 

—  6 

36 

+  156 

1896 

141 

—  7 

49 

126 

—  5 

25 

+  35 

1897 

150 

+  2 

4 

1!S 

+  1 

1 

+  2 

\  COQ 

163 

+  15 

225 

141 

+  10 

100 

-|-  150 

1899 

186 

+  38 

1444 

144 

+  13 

169 

+  494 

1900 

193 

+  45 

202b 

149 

+  18 

324 

+  810 

1901 

163 

+  15 

225 

151 

+  20 

400 

+  300 

1902 

179 

+  31  : 

961 

156 

+  25 

625 

+  775 

1903 

198 

+  50 

2500 

162 

+  31 

961 

+  1550 

1904 

211 

+  63  1 

3969 

.166 

+  35 

1225 

+  2205 

1905 

221 

+  73 

5329 

175 

+  44 

1936 

+  3212 

1906 

247 

+  99  j 

9801 

183 

+  52 

271  it 

+  5148 

1907 

259 

+  111 

12321 

187 

+  56 

3136 

+  6216 

1908 

221 

+  73 

5329 

181 

+  50 

2500 

+  3650 

M  =  148 

I 

69988     M  =131 

1 

23725 

39907 

S  (r  <f)  ?9%7 

r  =  n  ax  ay  =  40747,95 
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328.  Le  coefficient  r,  dans  la  forme  où  il  est  calculé  plus 
haut  est  une  expression  purement  numérique  qui  s'applique 
à  la  série  considérée  tout  entière. 

Le  calcul  repose  tout  d'abord  sur  la  moyenne  entre  toutes 
les  années  qui  composent  la  série;  c'est  d'après  cette 
moyenne  que  les  déviations  sont  calculées,  multipliées  entre 
elles,  portées  au  carré,  qui  lui-même  se  trouve  divisé  par  le 
nombre  d'années  d'observation,  etc.  Cette  expression  con- 
vient entièrement  pour  caractériser  l'évolution  respective 
de  deux  phénomènes  considérés  dans  leur  allure  et  dans 
leur  direction  générale,  mais  on  peut  concevoir  que 
l'objet  de  la  recherche  porte  sur  un  autre  point.  En 
effet,  la  direction  générale  des  courbes  n'est  pas  tou- 
jours le  seul  point  à  envisager  :  il  arrive  que  pour 
obtenir  une  représentation  exacte  du  phénomène  il 
faille  le  décomposer  et  envisager  séparément  ce  qu'on 
appelle  les  «  mouvements  séculaires  »,  c'est-à-dire  de 
très  longue  durée,  et  des  variations  plus  ou  moins  rapides 
de  grandeur,  observables  d'année  en  année  et  présentant 
fréquemment  un  caractère  périodique.  La  méthode  la  plus 
facile  pour  observer  ces  variations  courtes  est  due  à 
M.  Hooker  ;  elle  a  été  indiquée  et  appliquée  dans  un  travail 
publié  en  1901  portant  sur  la  covariation  entre  la  nuptia- 
lité et  l'ampleur  des  transactions  commerciales  extérieures, 
en  Angleterre  (1). 

Lorsque  l'on  compare  les  deux  courbes  de  la  nuptialité 
et  du  commerce  extérieur  par  tête  d'habitant  (importations 
et  exportations  "réunies),  on  remarque  que  les  deux  courbes 
ne  présentent  pas  la  même  allure  ;  tandis  que  celle  du  com- 
merce n'a  cessé  d'aller  en  montant,  celle  de  la  nuptialité  a 
subi  un  changement  de  direction  depuis  1873  et  sauf  un  re- 
lèvement passager  entre  1895  et  1900  a  cessé  de  garder  une 
direction  ascendante.  Ce  fait  est  très  bien  mis  en  évidence 


(1)  HoôKEE  (R.  H.),  «  Corrélation  of  tlie  Marriage  —  Rate  with  Trade  ». 
(Journal  Royal  Statistic  Society,  1901,  p.  485.) 
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par  le  coefficient  r  qui,  calculé  de  La  manière  ordinaire,  in- 
dique 0.18  comme  coefficient  de  covariation  entre  la  courbe 
du  commerce  extérieur  rapportée  à  la  population  et  Le  taux 
de  nuptialité.  Ce  coefficient  très  faible  ne  comporte  qu'une 
seule  interprétation  :  à  savoir  qu'il  n'existe  pas  de  rapport 
entre  les  deux  phénomènes. 

On  aurait  tort  de  s'en  tenir  à  cette  modalité  de  la  re- 
cherche, car  en  appliquant  une  autre  méthode,  d'une  grande 
simplicité,  M.  Hooker  établit  que  la  relation  entre  les  deux 
phénomènes  doit  être  exprimée  par  r  —  0.80.  Il  n'y  a  pas 
de  contradiction  entre  les  deux  résultats  :  en  effet,  le  pre- 
mier chiffre  obtenu  (0.18)  marque  qu'entre  la  direction  gé- 
nérale des  deux  faits  il  n'y  a  pas  de  rapport,  tandis  que  la 
seconde  donnée  signifie  qu'il  existe  une  relation  étroite 
entre  les  oscillations  des  deux  phénomènes.  Or,  c'est  bien 
le  second  coefficient  qui  fournit  la  réponse  la  plus  intéres- 
sante à  la  question  que  nous  nous  sommes  posée  :  ce  qu'il 
importe  de  savoir  c'est  si  les  échanges  du  commerce  exté- 
rieur exercent  une  influence  sur  le  taux  des  mariages  pen- 
dant une  période  plus  ou  moin i  brève  plutôt  que  d'être  in- 
formé de  la  relation  constante  qui  pourrait  exister  entre 
les  deux  faits.  La  méthode  suivie  par  M.  Hooker  nous  four- 
nit les  éléments  de  la  réponse  ei  c'est  à  ce  point  de  vue 
qu'elle  mérite  de  retenir  l'attention. 

Pour  mettre  en  évidence  la  relation  existante,  M.  Hoo- 
ker a  proposé  d'établir  les  déviations  non  par  rapport  à  la 
moyenne  générale,  mais  sur  des  moyennes  «  instantanées  » 
prises  pour  une  période  donnée.  L'étendue  du  temps  à  con- 
sidérer est  déterminée  d'une  façon  empirique  en  tenant 
compte  de  l'intervalle  qui  sépare  les  crêtes  des  oscillations, 
par  exemple  5,  7,  9  ou  11  années.  La  moyenne  des  valeurs 
pendant  cette  période  est  calculée  et  le  résultat  est  inscrit 
en  regard  de  la  valeur  primitive  centrale,  c'est-à-dire  que 
si  la  courbe  montre  une  période  de  n  années,  la  moyenne 
<(  instantanée  »  est  portée  en  regard  de  l'année  formant  le 
centre  de  la  période.  La  déviation  est  ensuite  calculée  entre 
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la  donnée  nouvelle  et  la  première  valeur,  on  procède  ensuite 
comme  pour  le  calcul  ordinaire  de  la  covariation  en  prenant 
soin  de  calculer  la  moyenne  des-  ai  et  a-  en  tenant  compte 
du  nombre  d'années  pour  lesquelles  les  valeurs  nouvelles  ont 
été  obtenues  et  en  négligeant  Celles  ayant  pour  valeur  0. 

329.  Nous  avons  nous-même  appliqué  cette  méthode  à 
l'étude  de  la  relation  entre  les  indices  de  la  production  et 
des  échanges  en  Belgique  de  1880  à  1908,  en  utilisant  lis 
matériaux  déjà  mis  en  œuvre  dans  notre  exemple  5.  (Cfr. 
n"  326.) 

Exemple  7.  —  Indices  de  la  production  et  des  échanges  en  Belgique, 

de  lb80  à  1908. 


Moyenne  instantanée  de  cinq  années  (  Wéthoile  Honher) 


PRODUCTION 

ECHANGES 

Années 

Index 
d"  la 
produc- 

Moyennes 
instanta- 
nées 

Variations 
par  rapport 
aux 

a?2 

Iniex 
de- 
écliai/g^s 

Moyennes 
instanta- 
nées 

Wi-dions 
par  rapport 
aux 

y* 

xy 

tion 

on  mobiles 

moyennes 

ou  mobiles 

moyennes 

(*) 

•yj 

1880 

102 

98 

1881 

102 

98 

1882 

110 

104  4 

-  5.6 

31  36 

99 

99  2 

-  0  2 

0  04 

+  1.12 

1883 

108 

102  6 

-  5  4 

29  16 

101 

99  4 

+  1  6 

2  56 

-  8.64 

1884 

100 

100  6 

-  0  6 

0  36 

100 

99  8 

+  0  2 

0  04 

-  0  12 

1885 

93 

98  6 

-  5  6 

31  36 

99 

100  8 

-  1  8 

3.24 

+10  08 

1886 

92 

98  0 

-  6  0 

36  00 

100 

101  8 

-  1  8 

3  24 

+10  80 

1887 

100 

101  0 

-  1  0 

1  00 

104 

103.8 

+  02 

0  04 

-  0  20 

1888 

105 

i07  4 

2  4 

5  76 

106 

107  2 

-  1  2. 

1  44 

+  2  88 

1889 

115 

113  0 

+  20 

4  00 

110 

111  2 

1  2 

1  44 

2  40 

1890 

125 

116  4 

+  86 

73  96 

116 

114  0 

+  20 

4  00 

+17  20 

1891 

120 

118  4 

+  1  6 

2  56 

120 

116  6 

+  34 

11.54 

+  5  44 

1892 

117 

119  4 

-    2  4 

5  76 

118 

119  0 

-  1  0 

1  00 

-i  24 

1893 

115 

118  8 

3  8 

14  44 

119 

121  6 

-  2  6 

6  76 

-+  9  88 

1894 

120 

123  0 

-  3  0 

9  00 

122 

122  0 

0 

0 

1895 

122 

129  6 

7  6 

50  16 

125 

124  8 

+  02 

0  04 

-  1  52 

1896 

141 

139  2 

+  1  8 

3  24 

126 

129  2 

-  3  2 

10  24 

-  5  76 

1897 

150 

152  4 

—  2  4 

5  76 

132 

133.6 

-  1  6 

2  56 

+  3  84 

1898 

163 

166  6 

3.6 

12  96 

141 

138  8 

+  22 

4.84 

-  7  02 

1899 

186 

171  0 

+15  0 

225  00 

144 

143.4 

+  06 

0  36 

+  9  00 

1900 

193 

176  8 

+16  2 

262  44 

149 

148  2 

-t  0  8 

0  64 

+12  06 

1901 

163 

183  8 

20  8 

432  64 

151 

152  4 

-  1  4 

1.96 

+28  72 

1902 

179 

188  8 

9  8 

96  04 

156 

156  8 

-  0  8 

0.64 

+  7  84 

190:5 

198 

194  4 

+  36 

12  96 

162 

162  0 

0 

0 

1904 

211 

211  2 

0  2 

0  04 

166 

168  4 

-  2  4 

5  76 

+  0  48 

1905 

221 

226  0 

-  5  0 

25  00 

175 

176  6 

-  1  6 

2  56 

+  8  00 

1906 

247 

231  8 

+15  2 

231  04 

183 

178.4 

+  46 

21  16 

+60  92 

1907 

259 

187 

1908 

221 

181 

1602  00 

85  50 

165.00 

«a*  o,     SU  93  ( 
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Le  résultat  du  calcul  montre  que  les  variations  de  la 
production  et  des  échanges  apparaissent  unies  par  un  lien 
beaucoup  plus  lâche  quand  on  considère  une  période  de 
brève  durée,  que  quand  on  s'attache  à  déterminer  la  direc- 
tion générale  des  faits;  c'est  la  conclusion  opposée  à  celle  à 
laquelle  M.  Hooker  avait  été  conduit,  cependant  la  covaria- 
tion  conserve  le  signe  positif. 

Puisque  le  degré  de  covariation  est  élevé  quand  on  envi- 
sage la  période  entière  et  qu'il  devient  plus  faible  quand 
on  remplace  la  moyenne  générale  par  une  moyenne  instan- 
tanée portant  sur  cinq  ans,  il  va  de  soi  qu'en  adoptant  une 
moyenne  mobile  comprenant  un  plus  grand  nombre  d'an- 
nées, onze  par  exemple,  on  doit  obtenir  un  coefficient  inter- 
médiaire entre  les  deux  valeurs  obtenues  précédemment. 
Nous  avons  procédé  aux  calculs  nécessaires  en  utilisant 
une  moyenne  instantanée  de  onze  ans,  et  nous  sommes  ar- 
rivé aux  chiffres  suivants  : 


S  (xy) 

=  484.62 

n 

=  19 

<*i 

=  13.206 

a* 

=  3  68 

r 

=  0.5248 

Le  résultat  obtenu  confirme  donc  l'hypothèse  émise  plus 
haut. 

330.  Les  méthodes  précédentes  sont  applicables  au  cas 
dans  lequel  les  variables  consistent  en  une  seule  expression 
comprenant  la  classe  tout  entière;  la  plupart  des  séries 
chronologiques  sont  dans  ce  cas.  Mais  un  autre  procédé 
s'impose  quand  il  s'agit  de  séries  comprenant  des  variables 
partagées  par  classes  de  grandeur  :  âges,  taux  de  salaire, 
taille,  périmètre  thoracique,  etc.,  par  exemple.  Ces  varia- 
bles sont  extrêmement  nombreuses,  la  méthode  pour  en  dé- 
terminer le  degré  de  covariation  ne  manque  pas  de  com- 
plexité et  exige  des  calculs  assez  laborieux. 
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M.  Yule  en  a  donné  une  démonstration  mathématique 
très  claire  que  nous  utilisons  en  partie  ci-après  avec  la  no- 
tation littérale  adoptée  par  l'auteur. 

Dans  le  calcul  du  coefficient  r  appliqué  à  deux  variables 
comprenant  plusieurs  classes,  il  faut  procéder  comme  dans 
la  recherche  de  la  moyenne  par  le  procédé  indirect  (Cfr. 
n"  '229),  c'est-à-dire  déterminer  deux  valeurs  arbitrairement 
choisies  et  exprimer  la  grandeur  des  écarts  par  l'éloigne- 
ment  des  classes  de  fréquence  à  partir  de  la  valeur  arbi- 
traire choisie  comme  origine. 

De  même  que  dans  le  cas  de  la  recherche  de  la  moyenne, 
appelons  s  les  déviations  de  l'une  des  variables  à  cette  ori- 
gine arbitraire,  et  n  les  déviations  de  la  seconde  variable. 
On  appelle  coordonnées  des  moyennes  les  valeurs  des  inter- 
valles de  classes  à  déterminer,  multipliées  l'une  par  l'autre 
avec  leur  signe  :  pour  les  distinguer  des  déviations,  on  les 
désigne  par  les  lettres  (surmontées  du  signe  — )  f  pour  la 
première  variable,  rï  pour  la  seconde. 

On  sait  que  la  somme  des  déviations  à  partir  de  l'origine 
arbitraire  est  égale  à  la  somme  des  déviations  (Ixy)  par 
rapport  à  la  moyenne,  augmentée  de  l'intervalle  de  classe 
entre  les  deux  valeurs  multipliées  par  le  nombre  de  termes 
ou  d'intervalles.  En  conséquence  : 

s  (En)  =  s  (.r?/)  +  N  gn  (71) 

ou  : 

S(^)  =  X(Hn)— N5n  (71) 

De  même  on  pose  que  si  p  représente  les  produit»  moyens 
calculés  sur  la  moyenne  ordinaire  et  p'  les  mêmes  produits 
établis  d'après  l'origine  arbitraire,  on  a  : 

p  =  p'  —  1  n  (72) 

Ces  équations  très  simples  servent  de  base  à  la  méthode. 
Nous  décrivons  celle-ci  avec  quelque  détail  à  raison  de  l'im- 
portance et  de  la  complication  qu'elle  présente  et  pour  plus 
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de  clarté  nous  décomposerons  les  différentes  parties  du  tra- 
vail arithmétique  appliqué  à  l'exemple  choisi. 

331.  Cet  exemple  est  celui  de  la  relation  existant 
entre  l'âge  du  mari  et  l'âge  de  la  femme  au  moment 
de  la  célébration  du  mariage.  Les  données  originales, 
qui  sont  ici  limitées  entre  les  données  —  21  ans  et 
45-50  ans  à  cause  du  manque  d'homogénéité  des  classes,  se 
trouvent  exposées  plus  haut,  n°  320.  Nous  adoptons  comme 
origine  arbitraire  pour  les  femmes  le  centre  de  la  colonne 
25-30,  soit  27,5  et  pour  les  hommes,  le  centre  de  la  ligne 
30-35  =  32,5  ;  le  point  de  jonction  de  ces  deux  origines  ar- 
bitraires tombe  à  la  fréquence  2646. 

Soit  à  rechercher  la  valeur  de  g  par  laquelle  nous  dési- 
gnons l'intervalle  de  classe  entre  la  moyenne  de  l'âge  des 
femmes  et  la  valeur  arbitraire  choisie  pour  cette  catégorie. 
Dans  ce  but,  nous  disposons  les-  fréquences  (femmes)  dans 
l'ordre  des  classes  en  adoptant  la  valeur  0  à  l'origine  arbi- 
traire 27,5  (/  =  11,967)  et  nous  effectuons  les  produits.  La 
somme  algébrique  des  produits  forme  le  numérateur  d'une 
fraction  dont  le  dénominateur  est  le  nombre  total  de  fré- 
quences (42.841). 

Nous  avons  donc  : 

2  (fi)  =  _  29.479  +  14.003  =  —  15.476 

 a k  / ne 

valeur  de  la  classe  d'intervalle  =  — '     ' ,  =  —  0.361 

42.841 

Nous  procédons  de  même  pour  r[  qui  représente  l'intervalle 
de  classe  entre  la  moyenne  de  l'âge  des  hommes  et  la  valeur 
arbitraire  choisie  pour  cette  catégorie  et  nous  obtenons  : 

S  (fx\)  -  —  45.056  +  9.208  =  -  35.848 

valeur  de  la  classe  d'intervalle  =  ~~  35.848  _  _ 

42.841 

d'où  il  résulte  que  s  Qfïp  est  de  valeur  positive  et  vaut  : 
—  0.361  X  —  0.836  =  -f  0.302  (0.301796) 
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Il  faut  ensuite  déterminer  les  valeurs  de  a  i  et  de  a  8;  on 
procède  comme  on  l'a  vu  plus-  haut  pour  le  calcul  de  la 
standard  déviation. 

Pour  la  première  variable  (femmes)  le  calcul  nous  donne  : 
S(/Ë2>  _  74.842  1  , 

L'intervalle  de  classe  —  o  3612  =  +  ? 

+  1.599 

^i  =  [/JM9  =  +  4  264 
Les  mêmes  calculs  sont  établis  pour  (r22  ;  on  a  : 

?JM  _  _  £  _  +  ,.„, 

N        42.841  2 

ff2  =  Vï^43  =  +  1-242 

332.  Ces  calculs  ont  déterminé  la  valeur  des  constantes 
F,  r\,  os  a2-  Il  reste  à  faire  la  recherche  du  coefficient  r  au 
moyen  d'une  table  de  corrélation  dans  laquelle  sont  indi- 
quées-, non  seulement  les  fréquences,  mais  encore  les  dévia- 
tions par  rapport  à  l'origine  arbitraire  admise  pour  cha- 
cune des  variables.  On  trouvera  cette  table  à  la  suite  de  ces 
lignes,  mais  auparavant  il  faut  faire  remarquer  que  les 
valeurs  positives  sont  groupées  dans  le  quartier  supérieur 
à  gauche  et  le  quartier  inférieur  à  droite,  tandis  que  les  va- 
leurs négatives  sont  placées  dans  le  quartier  supérieur  à 
droite  et  dans  le  quartier  inférieur  à  gauche.  Cette  dispo- 
sition est  déterminée  par  la  combinaison  des  signes  :  en 
effet,  les  valeurs  positives  pour  les  femmes  sont  à  droite, 
les  valeurs  négatives  à  gauche  ;  pour  les  hommes,  les  va- 
leurs négatives  sont  dans  la  partie  supérieure  du  tableau 
et  les  valeurs  positives  dans  la  partie  inférieure.  La  com- 
binaison des  signes  fournit  donc  la  disposition  en  croix  que 
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nous  avons  signalée,  comme  le  lecteur  pourra  s 'on  nssoror 
par  un  simple  schéma  graphique  (1). 

! 

!  EXEMPLE  8.  —  Ages  de  la  femme. 


A  (tes  des 
hommes 

-21 

21-25 

25-30 

30-35 

35-40 

40-45 

45-50 

Total 

-21 

774 
VI 

426 
III 

128 
O 

40 
III 

26 
VI 

2 

IX~ 

1 

XII 

1,397 

21-25 

3,401 
IV 

6,086 
II 

2,157 
O 

409 
11 

96 
IV 

39 
VI 

25 
VIII 

12,213 

25  30 

2,073 
II 

6,739 
I 

5,720 
0 

1,343 
I 

382 
II 

133 
III 

49 
IV 

16,439 

30  35 

498 
O 

1,669 
O 

2,646 

0 

1,601 
O 

442 
O 

180 
O 

78 
O 

7,114 

35  40 

140 

IT 
11 

441 

T 
1 

838 

V 

852 

T 
1 

512 

IT 
11 

221 

TU 
111 

105 

TV 
1  V 

3,100 

40-45 

40 
IV 

170 
II 

344 
O 

380 
II 

291 
IV 

250 
VI 

133 
VIII 

1,608 

45-50 

21 
VI 

54 

III 

134 
O 

195 
III 

187 
VI 

208 
IX 

1R2 
XII 

961 

Totaux. 

6,947 

15,585 

IL,  967 

4,820 

1,936 

1,033 

553 

42,841 

(1)  Le  schéma  suivant  peut  aider  le  lecteur  à  suivre  le  travail  effectué  au 
tableau  de  l'exemple  8. 


F  — 

H- 

+ 

F  + 
H  — 



F  — 
H  4 

F  + 
H  + 

+  ; 
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333.  Pour  trouver  le  total  des  fréquences,  on  procède 
comme  suit  à  l'aide  du  tableau  ci-dessus  en  tenant  compte 
de  la  valeur  et  du  signe  de  5  n  :  On  inscrit  dans  un  tableau 
spécial,  à  la  première  colonne  les  1  x\  qui,  dans  le  cas  actuel 
sont  1,  2,  3,  4,  6,  8,  9  et  12  et  l'on  fait  la  somme  algébrique 
des  produits  positifs  et  négatifs  trouvés  dans  chaque  quar- 
tier en  la  multipliant  avec  son  signe,  par  la  valeur  de  g  r\  ; 
on  fait  ensuite  la  somme  des  fréquences  positives,  néga- 
tives et  en  croix,  de  manière  à  retrouver  le  total  des  fré- 
quences. Les  résultats  du  calcul  sont  indiqués  ci-après  : 


Fréquences 

En  + 

I.  6739  +  852  

II  6086  -)-  2073  -(-  512  -|-  830 

III.  426  +  221  +  195 

IV.  3401  +  291  +  105 
VI.   774  +  250  +  187 

VIII.  133  

IX.  208  

XII.  162  


-  =  (An 

1343  +  441     .    .    .    .  +  5807  =  +  5807 

382  +  170  +  409  +  140  +  7950  =  -f  15900 

133  +  40  +  54    .    .  +  615  =  +  1845 

96  +  49  +  40    .    .  +  3612  =  +  14448 

26  +  39  +  21    .    .  +  1125  =  +  6750 

25    +   108  =  +  864 

2    +  206  =  +  1854 

1   +  161  =  +  1932 


22995 


3411 


+  49400 


On  retrouve  le  total  des  fréquences  : 

22993  +  3411  +  (11967  +  7114  —  2646)  ==  42841 


P  = 


La  somme  algébrique  des  fréquences  par  Er\  —  49.400. 
49  400 


1.153 
42.N41 

£  rj  =      ( —  0.361  x  —  0.836)  =  +  0.302  (0.301796) 
p  =  f  —  îr\  =  1.133  —  0  302  ==  +  0.851 

+  0.851  0.851 
1 .264  x  1 .242       r  1 .569  ~ 


La  covariation  des  âges  des  époux,  dans  les  limites  consi- 
dérées (-21  à  45-50)  est  donc  égale  à  +  0.542.  Si  elle  était 
absolue,  elle  équivaudrait  à  l'unité  ;  dans  le  cas  où  elle  serait 
nulle,  elle  serait  exprimée  par  0;  si  elle  était  en  sens  in- 
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verse  elle  serait  précédée  du  signe  —  et  pourrait  prendre 
toutes  les  valeurs  jusqu'à  —  1.  D'après  la  valeur  de  r 
(-f  0.542)  il  existe  certainement  une  relation  entre  les  âges 
des  époux  au  moment  de  la  célébration  du  mariage  mais 
cette  relation  n'est  pas  très  étroite  et  laisse  place  à  de  nom- 
breuses exceptions. 

Il  est  à  remarquer  que  l'intervalle  de  classe  doit  être  ici 
pris  pour  l'unité  étant  donné  que  l'unité  est  ici  cinq  ans;  il 
n'y  a  donc  pas  de  réduction  à  effectuer. 

334.  Après  avoir  étudié  les  moyens  de  calcul  mis  en 
œuvre  dans  la  recherche  de  la  covariation  de  deux  faits,  le 
lecteur  est  à  même  de  mieux  se  rendre  compte  de  la  valeur 
pratique  du  procédé.  Le  secours  qu  'il  apporte  au  chercheur 
dans  la  détermination  des  relations  entre  phénomènes  est 
indiscutable.  On  peut  poser  qu'en  dehors  des  cas  de  paral- 
lélisme parfait,  il  est  radicalement  impossible  d'apprécier 
par  la  vue  seule  avec  exactitude,  c'est-à-dire  avec  leurs  re- 
lations mathématiques,  les  mouvements  de  deux  courbes. 
Les  statisticiens  qui  ne  font  pas  usage  des  procédés-  décrits 
dans  le  présent  chapitre,  particulièrement  du  plus  parfait 
d'entre  eux,  le  calcul  du  coefficient  de  covariation,  sont  li- 
vrés à  toutes  les  hésitations  et  condamnés  à  rester  dans  l'im- 
précision, à  moins  qu'ils  ne  soient  conduits  à  conclure  dans 
le  sens  de  leurs  opinions  subjectives,  ce  qui  est  plus  fâcheux 
encore.  En  voici  un  exemple  typique  :  voulant  déterminer 
la  corrélation  entre  la  tendance  au  mariage  et  l'état  de 
prospérité  économique,  M.  Hector  Denis,  après  avoir  rejeté 
les  indices  uniques  tels  que  la  variation  du  prix  du  blé  et  la 
consommation  du  charbon,  écrit  :  «  Je  crois  avoir  trouvé 
une  expression  plus  nette  de  l'influence  de  l'état  écono- 
mique sur  la  tendance  au  mariage.  Elle  est  dans  les  varia- 
tions de  l'ensemble  même  des  prix,  dans  les  index-numbers. 
Avec  la  hausse  générale  des  prix,  l'esprit  d'entreprise  se 
développe,  la  demande  de  travail  s'accroît,  les  salaires 
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s'élèvent,  la  tendance  à  contracter  mariage  devient  plus 
vive,  le  nombre  des  naissances  s'élève  (1).  » 

Pour  étudier  la  covariation  des  trois  phénomènes^ 
M.  Hector  Denis  dispose  un  tableau  à  trois  colonnes  :  l'in* 
dex  numbers  de  28  articles  exportés,  sur  la  base  1866-1877 
=100,  le  nombre  de  mariages  par  1,000  habitants,  le  nombre 
de  naissances  par  1,000  habitants.  Il  est  à  remarquer  que 
pour  avoir  une  base  de  comparaison  correcte,  les  nombres 
des  mariages  et  des  naissances  auraient  dû  être  calculés  par 
le  procédé  des  index-numbers.  La  même  remarque  est  à 
faire  à  propos  des  graphiques.  C'est  sur  ces  éléments  non 
comparables  que  M.  Hector  Denis  a  basé  la  conclusion  que 
nous  venons  de  lire. 

335.  Le  calcul  donne  les  résultats  ci-après  : 
La  covariation  des  index-numbers  des  prix  et  des  ma- 
riages, envisagée  pour  la  période  entière  1850-1887  est  ex- 
primée par  les  données  ci-après  : 

2  xy  =  1304.66 
■G*'-  |/ÏÔ5^T=  10.279 
qy  =  1/39TÔ7   =  6.2507 
n  =  37 

L'équation  finale  est 

.J3  (çj/j_  1304,66   1304.66  _ 

n  ax  ay  ~  37 x  10.27y  x  6.2507  ~~  2377.28  ~  °-548 

Le  coefficient  de  covariation  est  donc  positif,  mais  on  ne 
peut  affirmer  avec  certitude  qu'il  existe  une  relation  effec- 
tive de  cause  à  effet  entre  les  deux  phénomènes.  Des  sta- 
tisticiens autorisés,  comme  M.  G.  Mortara,  par  exemple, 
n'admettent  la  signification  du  coefficient  r  que  lorsqu'il 


!  ;    ■  ■  . 

(1)  HecTor  Denis,  La  dépression  économique  et  sociale  et  l'histoire  du  prix. 
Bruxelles,  1895,  p.  150.  ' 
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atteint  une  valeur  numérique  beaucoup  plus  considérable. 

Il  reste  à  rechercher  si  ce  coefficient  ne  se  modifie  pas 
quand  on  considère  une  succession  de  mouvements  de 
moindre  étendue.  Dans  ce  but,  nous  avons  recours  à  la  mé- 
thode de  Hooker,  exposée  plus  haut,  et  nous  adoptons 
comme  base  du  «  trend  »  la  moyenne  prise  sur  7  années 
consécutives.  Nous  avons  dans  ce  cas  : 


S.083 
5.199 

Nous  posons  l'équation  : 

Sfry)  =  394   ^_  o  514 

naa      29  X  5.083  X  5.199     766  ~  ' 

ce  y 

Bien  que  le  résultat  auquel  on  arrive  par  l'emploi  du 
<(  trend  »  soit  un  peu  moins  marqué  que  lorsqu'on  envisage 
la  relation  générale  entre  les  deux  phénomènes,  on  peut 
affirmer,  étant  donnée  la  faible  différence  entre  les  ré- 
sultats obtenus,  qu'il  y  a  identité  de  signification  entre  les 
deux  méthodes  employées. 

L'induction  tirée  par  M.  Hector  Denis  de  l'allure  des  sé- 
ries paraît  donc  aboutir  à  une  conclusion  exagérée  ;  il  est 
nécessaire  de  recourir  au  calcul  pour  la  corriger,  la  préci- 
ser et  la  ramener  à  ses  proportions  légitimes,  qui  laissent 
place  au  doute  au  lieu  d'aboutir  à  formuler  une  sorte  de  loi 
générale.  . 

V.  —  Equations  de  régression. 

336.  Sous  le  nom  d'équation  de  régression  on  désigne 
un  procédé  d'investigation  complémentaire  à  la  méthode 
des  corrélations. 

Tandis  que  le  coefficient  de  corrélation  exprime  numéri- 
quement le  degré  d 'affinité  qui  peut  exister  entre  la  marche 
de  deux  phénomènes  ou  d'un  plus  grand  nombre  de  faits 


2  xy =  394 
<*œ  =1/ 257843  = 
ff„    1/27.034  = 
n  =  29 
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(Cfr.  VI),  les  équations  de  régression  permettent  de  dé- 
terminer les  rapports-  de  dépendance  des  mouvements  des 
divers  phénomènes  entre  eux.  Elles  répondent  à  la  question 
suivante  pour  le  cas  de  deux  variables  :  à  quel  changement 
de  valeur  du  phénomène  A  correspond  le  changement 
de  valeur  m  du  phénomène  B 1  S 'il  s 'agit  de  trois  variables, 
les  équations  de  régression  envisageront  les  changements 
de  valeur  de  B  et  C  par  rapport  à  A,  de  A  et  C  par  rapport 
à  B  de  A  et  B  par  1  apport  à  C.  Le  coefficient  de  corrélation 
n'exprime  donc  que  le  degré  d'affinité  entre  deux  faits,  tan- 
dis que  les  équations  de  régression  font  connaître  quelque 
chose  de  plus,  la  répercussion  que  tout  changement  de  va- 
leur de  A  aura  sur  tout  changement  de  valeur  de  B.  Ainsi 
après  les  indications  fournies  par  le  coefficient  de  corré- 
lation en  ce  qui  concerne  les  rapports  qui  unissent  deux 
phénomènes,  les  équations  de  régression  viennent  présenter 
un  autre  aspect  de  la  même  relation. 

337.  Il  est  désirable  d'établir  sommairement  la  ge- 
nèse des  équations  de  régression.  Pour  suivre  cet  ex- 
posé le  lecteur  voudra  bien  se  reporter  à  la  figure  28, 
qui  représente  par  une  ligne  R  R  les  moyennes  des  lignes 
horizontales  dans  une  table  de  contingence  et  par  une  ligne 
CC  les  moyennes  des  colonnes  verticales. 

Soit  M2  la  valeur  moyenne  de  Y  et  soit  RR  coupant  l'ho- 
rizontale M2x  en  M.  Dans  cette  hypothèse,  la  verticale  pas- 
sant par  le  point  M,  coupera  o  X  en  Mi  (1).  Or  Mt  étant 
la  moyenne  de  X,  il  s'en  suit  que  la  verticale  passant  par 
le  point  Mi  passe  aussi  par  la  moyenne  de  o  X. 

En  effet,  considérons  l'inclinaison  de  RR  par  rapport  à 
la  verticale.  La  tangente  (2)  de  l'angle  MXMR  ou  le  rap- 


(1)  Cette  théorie  est  basée  sur  le  théorème  suivant  :  D'un  point  pris 
hors  d'une  droite,  on  peut  mener  une  perpendiculaire  à  cette  droite,  et 
on  n'en  peut  mener  qu'une. 

(2)  La  tangente  est  la  perpendiculaire  élevée  à  l'extrémité  du  rayon  qui 
passe  par  l'origine,  jusqu'à  la  rencontre  du  rayon  prolongé  qui  passe  par 
l'extrémité  de  l'arc. 
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port  de  KL  à  LM  est  bi.  Admettons  que  les  déviations 
observées  à  partir  de  MY  et  MX  soient  notées-  par  x  et 
par  y.  Il  en  résulte  que  pour  chaque  colonne  horizontale 
du  type  y  dans  lequel  le  nombre  des  observations  est  n, 
nous  aurons  : 

2  [x)  =  nb1  y 

et  par  conséquent,  puisque  2  (n  y)  =  0  il  viendra  pour 
toute  la  table  2  (x)  =  b^{ny)  =  0._M,  est  donc  la  moyenne 
de  X  et  M  devient  la  moyenne  de  toute  la  distribution. 

'A  l'aide  du  raisonnement  qui  précède,  il  est  notamment 
établi  que  RR  passe  en  M.  Il  reste  maintenant  à  détermi- 
ner b2.  Cette  détermination  peut  s'exprimer  par  les  termes 
du  produit  moyen  de  tous  les  accouplements  de  lettres  des 
déviations  associés  x  et  y. 
D'où  la  formule  : 

P  =  ^  S  (x  y)  (73) 

Pour  chacune  des  colonnes  horizontales,  il  viendra  : 
2  (x  y)  =  y  2  (x)  =  nbi  y2 
et  pour  toute  la  table  : 

2  (x  y)  =  b,  S  (n  y*)  =  N  bx  a\ 

or 

*i  =  -§r  (74) 

y 

De  même  si  CC  est  la  Ugne  sur  laquelle  tombent  les 
moyennes  des  colonnes  verticales  et  si  b2  est,  l'inclinaison 
par  rapport  à  l'horizontale,  r  s/s  M,  il  viendra  : 

h  =  -§r  (75) 

Il  est  d'usage  d'inscrire  les  équations  (74)  et  (75)  sous 
la  forme  suivante  : 
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En  adoptant  cette  dernière  notation,  on  en  tire  : 

h  =  r  H*  bt  =  r^-  (77) 

Dès  lors,  en  écrivant  les  équations  (49)  en  fonction  de 
RR  et  de  CC,  nous  aurons  : 

x  =  r%*y  y  =  r^-x  (78) 

Ces  dernières  équations  peuvent  évidemment  être  ex- 
primées dans  les  termes  des  variables  X  et  Y  plutôt  que 
dans  les  termes  des  déviations  x  et  y. 

Quant  aux  équations  (77)  les  quantités  qu'elles  expri- 
ment sont  appelées  les  coefficients  de  régression  ou,  plus 
simplement  les  régressions,  b±  est  la  régression  de  x  sur  y 
ou  l'écart  en  x  qui  correspond,  en  fonction  de  la  moyenne, 
à  un  changement  de  une  unité  en  Y.  De  même  b2  est  la  ré- 
gression de  y  sur  x,  ou  l'écart  y  qui  correspond,  en  fonc- 
tion de  la  moyenne,  à  un  changement  de  une  unité  en  x. 

338.  D'après  les  formules  précédentes,  nous  pouvons 
calculer  les  équations  de  régression  applicables  aux  don- 
nées de  l'exemple  6.  (Cfr.  n°  327.)  Le  coefficient  entre  les 
données  concernant  la  production  et  celles  relatives  aux 
échanges  est  positif  et  très  élevé  :  +  0-979- 

Nous  savons  que 

b  —  r   00 , 

1  ^ 

u 

En  remplaçant  cette  expression  littérale  par  sa  valeur 
numérique  nous  avons  : 

49  126 

^  =  +  0  979feo^  =  +  1•(58i 

Nous  avons  vu  que 
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D'où,  en  recourant  aux  données  de  l'exemple  6,  nous 
tirons  les  valeurs  numériques  : 

2K  002 

Comme  l'a  fait  remarquer  M.  Udny  Yule  dans  sa  remar- 
quable exposition  de  la  corrélation  entre  le  taux  des  salaires 
agricoles  et  la  proportion  de  la  population  secourue  dans 
trente-huit  districts  anglais  (1)  on  peut,  pour  le  calcul,  rem- 
placer la  valeur  des  x  et  des  y,  c'est-à-dire  les  déviations  à 
la  moyenne,  par  les  valeurs  moyennes  absolues  des  va- 
riables. 

Recherchons  d'après  ce  procédé,  la  valeur  de  l'équa- 
tion bx.  Nous  posons,  d'après  les  calculs  de  l'exemple  6  cité 
plus  haut  : 

X  =  148 
Y"  =131 

L'équation  br  devient  : 

X  —  148  =  1.081  (Y  —  131) 

Simplifions  et  transformons  l'équation.  On  a  : 

1°  X  =  +  1.081  (Y  —  13I)  +  148 

2°  X  ==  4-  1.081  Y  -  [(1.681)  (131)]  +  148 

En  effectuant  la  parenthèse,  il  vient  : 

3o  X  =  1.681  Y  —  220  2l  1  +  148 
4°  X  =  —  71211  +  1.084  Y 

Cette  équation  est  l'équation  bt  cherchée. 
De  même,  nous  pouvons  substituer  à  y  la  valeur  Y  et  re- 
chercher dans  ces  conditions  la  valeur  de  l'équation  b2. 


(1)  Cfr.  Udny  Yule,  loc.  cit.,  p.  179. 
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Nous  effectuons  les  calculs  suivants  : 

Y  —  131  =  0.SH9  (X  —  148) 
y  est  ici  remplacé  par  sa  valeur  Y  131. 
x  est  remplacé  par  sa  valeur  X  148. 
Nous  simplifions  et  transformons  : 

1°  Y  =  0.569  (X  —  148)  +  131 

2°  Y  =  0.569  X  +  [(0  569)  (—  148) J  +  131 

3°  Y  =  0  569  X  —  84  212  -1-  131 

4°  Y  =  —  46.788  +  0.569  X 

Ce  qui  constitue  l'équation  b>  cherchée. 

Finalement  nous  obtenons  les  équations  de  régression  : 

X  =  —  72.211  +  4.681  Y 

Y  =  —  46  788  4-  0.569  X 

Dans  l'interprétation  de  ce  résultat,  il  ne  faut  pas  perdre 
de  vue  que  les  modifications  se  rapportent  à  un  chiffre 
index  100  calculé  sur  l'année  1884. 

VI.  —  Calcul  des  corrélations  à  trois  variables. 

339.  Les  calculs  précédents  concernent  le  cas  où  deux  va- 
riables seulement  se  trouvent  réunies.  On  peut  concevoir  la 
possibilité  d'une  telle  rencontre  lorsqu'il  s'agit  de  phéno- 
mènes très  simples,  placés  directement  sous  l'influence  l'un 
de  l'autre;  mais  lorsqu'il  est  question  de  faits  plus  com- 
pliqués, l'hypothèse  de  l'existence  de  deux  variables  seule- 
ment cesse  d'être  vraisemblable.  La  complexité  des  phéno- 
mènes économiques,  particulièrement,  atteint  un  degré 
élevé.  On  aimerait  cependant  à  démêler  les  causes  agis- 
santes et  à  leur  attribuer  leur  importance  réelle.  Le  peut-on 
toujours  à  l'aide  des  calculs-  de  la  co variation?  La  réponse 
nous  semble  négative,  tout  d'abord  parce  que  le  nombre 
de  causes  reconnues  est  trop  grand  pour  que,  pratiquement, 
il  soit  possible  de  les  soumettre  au  calcul;  ensuite,  parce 
qu'à  mesure  de  l'augmentation  du  nombre  des  élé- 
ments de  la  formule,  celle-ci  perd  de  sa  précision  et 
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que  son  interprétation  devient  très  délicate.  Les  résultats 
d'un  calcul  ne  peuvent  jamais  être  en  contradiction  avec  la 
logique;  on  ne  peut  affirmer  qu'il  en  serait  toujours  ainsi 
avec  le  calcul  des  covariations  étendues  à  un  nombre  n  de 
variables.  La  prudence  dans  les  conclusions,  qui  a  déjà  été 
recommandée  à  propos  de  la  covariation  à  deux  variables 
est  donc  de  mise,  plus  que  jamais,  quand  if  s 'agit  de  trois 
variables  et  plus.  Les  statisticiens  anglais  qui  ont  créé  la 
théorie  de  la  corrélation  à  n  variables  le  font  expressément 
observer. 

A  moins  de  dépasser  de  beaucoup  les  limites  que  nous 
avons  assignées  au  présent  ouvrage  dans  le  domaine  des 
sciences  mathématiques,  nous  ne  pourrions  aborder  ici  l'ex- 
posé de  la  théorie  mathématique  de  la  corrélation  à  n  va- 
riables. Elle  n'est  cependant  que  la  suite  logique  de  la  théo- 
rie de  la  corrélation  à  deux  variables,  mais  elle  est  néces- 
sairement beaucoup  plus  compliquée.  Nous  essaierons  de 
donner  une  idée  claire  du  travail  arithmétique  à  effectuer 
pour  la  solution  des  équations,  sans  entrer  dans  l'exposé 
théorique  de  la  méthode;  le  lecteur  pourra  de  la  sorte  se 
faire  une  idée  pratique  de  la  question,  mais  pour  la  partie 
théorique  et  démonstrative,  il  devra  nécessairement  recou- 
rir aux  traités  de  statistique  mathématique  et  aux  tra- 
vaux spéciaux  indiqués  aux  références  :  les  ouvrages  de 
MM.  Pearson  et  Yule  doivent  être  lus  et  relus  par  les  tra- 
vailleurs désireux  d'approfondir  ces  matières. 

340.  L'exemple  de  covariation  à  trois  variables  que  nous 
avons  choisi  comme  illustration  du  travail  arithmétique  est 
tiré  de  la  «  Statistique  des  Industries  extractives  et  métal- 
lurgiques »  publiée  par  l'administration  des  mines  en  Bel- 
gique. Les  chiffres  de  deux  des  données  que  nous  allons 
utiliser  ont  déjà  été  donnés  dans  l'exemple  3  (Cfr.  n°  316), 
où  nous  avons  calculé  le  coefficient  I  de  dépendance  entre 
le  bénéfice  à  la  tonne  et  le  salaire  journalier  moyen  des  ou- 
vriers du  fond  entre  1885  et  1915.  Aux  deux  données 
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dont  il  s'agit,  nous  en  ajoutons  une  troisième  :  la  valeur 
moyenne  de  la  tonne  de  charbon.  Il  s'agit  donc  de  détermi- 
ner quelle  est  la  relation  numérique  existante  entre  ces 
trois  éléments  :  le  bénéfice  à  la  tonne  (X:),  la  vaieur 
moyenne  à  la  tonne  (X2),  le  salaire  journalier  moyen  de 
l'ouvrier  du  fond  (X3). 

Dans  sa  forme  la  plus  simple  l'équation  à  l'aide  de  la- 
quelle se  calcule  la  corrélation  à  trois  variables  s'écrit 
comme  suit  : 

r    —  r  r 

'  '-a~  V  -'„r  (•--■„)•  (79> 

Les  indices  dont  les  coefficients  de  corrélation  sont  affec- 
tés sont  l'objet  d'une  notation  spéciale.  Les  premiers  in- 
dices comprennent  chacun  deux  chiffres  sur  trois  chiffres 
existants  concernant  chacune  des  trois  variables.  Le 
premier  des  deux  chiffres  se  rapporte  à  la  variable  indé- 
pendante, à  la  fonction;  le  second  chiffre  désigne  la  va- 
riable en  fonction  de  laquelle  les  variations  de  la  variable 
dépendante  sont  observées.  Ainsi  les  coefficients  de  corré- 
lation ci-après  se  rapportent  : 

rn,  au  bénéfice  à  la  tonne  (X,)  en  fonction  de  la  valeur  à  la  tonne  (X2) 
r13,  au  bénéfice  à  la  tonne  (X,)  en  fonction  du  salnircjou  ma  lier  moyen  (X3) 
r23,  à  la  valeur  à  la  tonne  (X2)  en  fonction  du  salaire  journaliermoyen  (X3^ 

Les  indices  en  question  sont  appelés  indices  primaires; 
on  les  appelle  aussi  indices  de  V ordre  zéro. 

La  suite  du  calcul  a  pour  objet  de  déterminer  les  coeffi- 
cients de  corrélation  du  premier  ordre.  Ceux-ci  sont  affec- 
tés chacun  de  deux  indices  primaires  et  d'un  indice  secon- 
daire; les  indices  secondaires  désignent  les  variables  res: 
tantes.  Nous  avons  ainsi  : 

r12  3  =  corrélation  de  X1?  en  fonction  de  X2,  reste  X3 
ri3  2  =  corrélation  de  Xr  en  fonction  de  X3,  reste  X2 
rn  î  =  corrélation  de  X2,  en  fonction  de  X3,  reste  Xj 


COVAItlATION 


54* 


341.  Nous  procéderons  dans  l'ordre  des  calculs  et  nous 
placerons  sous  les  yeux  du  lecteur  la  suite  des  opérations. 

En  premier  lieu,  nous  reproduisons  les  données  numé- 
riques originales. 


Bénéfice  à  la  tonne,  valeur  à  la  tonne  et  salaire  journalier  moyen 
de  l'ouvrier  du  fond  dans  les  charbonnages  de  Belgique, 
de  1885  à  1911. 


Années 

Bénéfice 
à  la  tonne  (X|) 

Valeur 
à  la  tonne  (X2) 

Salaire  journalier 
moyen  (X3) 

À  NlMI7tTQ 

Francs 

Francs 

Francs 

1885 

o 

40 

8 

87 

3 

20 

1885 

18*6 

o 

30 

8 

25 

2 

94 

1886 

1887 

o 

48 

8 

04 

2 

99 

1887 

1888 

o 

65 

8 

43 

3 

10 

1888 

1889 

1 

11 

9 

45 

3 

42 

1889 

1890 

2 

84 

13 

14 

4 

20 

1890 

1891 

1 

82 

12 

58 

4 

18 

1891 

1892 

o 

60 

10 

28 

3 

56 

1892 

1893 

o 

33 

9 

3 

29 

1893 

1894 

o 

40 

q 

3 

25 

1894 

1895 

0 

40 

9 

45 

3 

43 

1895 

1896 

0 

52 

9 

50 

3 

49 

1896 

1897 

0 

90 

10 

26 

3 

72 

1897 

1898 

1 

05 

11 

00 

3 

94 

1898 

1899 

1 

71 

12 

43 

4 

37 

1899 

1900 

4 

26 

17 

41 

5 

21 

1900 

1901 

2 

33 

15 

23 

4 

69 

1901 

1902 

1 

41 

13 

20 

4 

39 

1902 

1903 

1 

23 

12 

99 

4 

38 

1903 

1904 

0 

75 

12 

59 

4 

20 

1904 

1905 

0 

83 

12 

64 

4 

28 

1905 

1906 

1 

91 

15 

00 

4 

98 

1906 

1907 

2 

16 

16 

86 

5 

52 

1907 

1908 

1 

37 

16 

14 

5 

17 

1908 

1909 

0 

74 

14 

37 

4 

64 

1909 

1910 

0 

50 

14 

59 

4 

85 

1910 

1911 

0 

14 

14 

76 

4 

96 

1911 
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342.  Il  faut  commencer  par  chercher  les  constantes  de 
chacune  des  séries  de  variables.  Par  M  nous  désignons  la 
moyenne  de  la  série,  par  o  la  standard-déviation,  par  r  le 
coefficient  de  corrélation,  chacune  de  ces  lettres  étant  affec- 
tée de  l'indice  de  la  série  de  variables. 

Nous  calculons  les  M  d'après  la  formule  (3)  : 

U  =  j.?  (X) 

et  nous  obtenons 

Mt  =  1.153    M2  =  12.078         M3  ==  4.087 

Outre  les  moyennes,  nous  avons  à  calculer  la  standard- 
déviation  de  chacune  des  séries.  Rappelons  la  formule  (14a). 

a*  =  ±-  2  (*■) 

Nous  reproduisons,  page  545,  pour  guider  le  lecteur,  les 
calculs  servant  à  déterminer  la  standard-déviation  de  la  sé- 
rie relative  au  bénéfice  à  la  tonne  (ax). 

Nous  calculons  de  même  les  standard-déviation  de  X2  et 
X3  et  nous  obtenons  les  constantes  : 

at  =  2.768         <r3  =  0.741 

Il  faut  ensuite  calculer  les  coefficients  de  corrélation 
existant  entre  : 

1°  X,  etX2;     2°  XjetX3;     3°  X2  et  X3. 

Ces  calculs,  parfois  assez  laborieux,  nous  mettent  en  pos- 
session des  constantes  de  corrélation  qui  s'inscrivent  dans 
la  première  colonne  du  tableau  ci-après  (p.  548)  intitulé  : 
«  Tableau  du  calcul  de  la  corrélation  à  trois  variables.  » 

343.  Nous  déterminons  comme  suit  la  première  constante 
corrélative  entre  Xi  et  X2  et  pour  permettre  au  lecteur  de 
suivre  tous  les  détails  de  l'opération,  nous  reproduisons 
page  546  les  calculs  nécessaires  pour  déterminer  r12. 
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Calcul  de  o~ 


Années 

Bénéfice 
à  la  tonne 

Écarts  (x) 
à  la  moyenne 

«2 

Années 

1885 

0.40 

0 

753 

0. 

567009 

1885 

1886 

0.30 

0. 

853 

0 

727H09 

1886 

1887 

0.48 

0 

673 

0. 

452929 

1887 

1888 

0.65 

0 

503 

0 

253009 

1888 

1  P.8Q 

î  ooy 

î  1 1 

0 

043 

0 

001849 

1  B8Q 

9  R4 

1 

687 

2 

845969 

1  kQfi 

1891 

1 .82 

0 

667 

0 

444889 

1891 

1892 

0.60 

0 

5ô3 

0 

305809 

1892 

1893 

0.33 

0 

823 

0 

677329 

1893 

1 894 

fi  4fi 

0 

753 

0 

567009 

1 OVJ4 

1895 

fi  4fi 

0 

753 

0 

567009 

1  8Q^ 

1896 

0.52 

0 

623 

0 

400689 

1896 

1897 

0.90 

0 

253 

0 

064009 

1897 

1898 

1 .05 

0 

103 

0 

010609 

1898 

1899 

1  71 

0 

557 

0 

310249 

1  QQO 

1900 

3 

107 

9 

653449 

iyuu 

1901 

2.33 

1 

177 

1 

38o329 

1901 

1902 

1 .41 

0 

257 

0 

066049 

1902 

1903 

1.23 

0 

077 

0 

005929 

1903 

1904 

0.75 

0 

403 

0 

.162409 

1904 

1905 

0.83 

0 

323 

0 

104329 

1905 

1906 

1.91 

0 

757 

0 

573049 

1906 

1907 

2.16 

1 

007 

1 

.014049 

1907 

1908 

1.37 

0 

.217 

0 

047089 

1908 

1909 

0.74 

0 

413 

0 

.170569 

1909 

1910 

0.50 

0 

.653 

0 

.426409 

1910 

1911 

0.14 

1 

.013 

1 

.026169 

1911 

ï.x2  =  22.828803 
o*2  =       ^      =  0.845511  ou  0.8455 


<r  =  [/  0\8455  =  0.919510739 
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Calcul  de  rn  (1  =  bénéfice  à  la  tonne,  2  =  valeur  à  la  tonne) 


BÉNÉFICE  A  LA  TONNE 

VALEUR  A  LA  TONNE 

Années 

Impor- 
tance du 
bénéfice 

Ecarts 

par 
rapport 

à  la 
moyenne 
lie) 

x>- 

Valeur 
à  la 
tonue 

Ecarts 

à  la 
moyenne 

y) 

xy 

Années 

fr. 

r. 

1885 

0.40 

-0.753 

0.567009 

8.87 

—3.208 

10.291264 

+  2.415624 

1885 

1886 

0.30 

—0.853 

0.727609 

8.25 

—3  828 

14.653584 

+  3.265284 

1886 

1887 

0.48 

-0.673 

0.452924 

8.04 

-4  038 

16.305444 

+  2.717574 

1887 

1888 

0.65 

—0  503 

0 . 253009 

8.43 

—3.648 

13  307904 

+  1.834944 

1888 

1889 

1.11 

— 0 . 043 

0.001849 

9  45 

—2.628 

6.906384 

+  0. 113004 

1889 

2.84 

+1.687 

2.8459b9 

13.14 

+1.062 

1. 127844 

4-  \  7Q1CS94 

1890 

1891 

1.82 

+0.667 

0.444889 

12.58 

+0.502 

0.252004 

+  0.334834 

1891 

1892 

0  60 

-  0.553 

0.305809 

10.28 

—1.798 

3  232804 

+  0.994294 

1892 

1893 

0.33 

—  0.823 

0 . 677329 

9.35 

— 2 . 728 

7.441984 

+  2.245144 

1893 

1894 

0.40 

-0.753 

0 . 567009 

9  32 

—2.758 

7.606564 

+  l  076774 

1894 

0.40 

— 0 . 753 

0 . 56  / 009 

9.45 

— 2 . 628 

6.906384 

_I_  1  Q7S884 

1895 

1896 

0.52 

—0  633 

0.400689 

9.50 

—2.578 

6.646084 

+  1  631874 

1896 

1897 

0.90 

—0.253 

0  064009 

10  26 

—1.818 

3.305124 

+  0.459954 

1897 

1898 

1.05 

— 0 . 103 

0.010609 

11  00 

— 1 .078 

1 . 162084 

+  0.111034 

1898 

1899 

1.71 

+0.557 

f\    o  A  ah  j  r\ 

0.310249 

12.43 

+0.352 

0. 123904 

1      A    A A£A£  A 

+  0 . 196064 

A  OAA 

1899 

1Q00 

4.26 

+3.107 

9.653449 

17.41 

+5.332 

28.430224 

+16.566524 

1900 

1901 

2.33 

+1.177 

1.385329 

15.23 

+3.152 

9  935104 

+  3.709904 

1901 

1902 

1.41 

+0.257 

0  066049 

13.20 

+1.122 

1.258884 

+  0.288354 

1902 

1903 

1.23 

+0.077 

0.005929 

12.99 

+0.912 

0.831744 

+  0.070224 

1903 

1904 

0,75 

—0  403 

0.162409 

12.59 

+0.512 

0.262144 

—  0.206336 

1904 

1905 

0.83 

—0  323 

0.104329 

12.64 

+0.562 

0.315844 

—  0.181526 

1905 

1906 

1.91 

+0.757 

0.573049 

15.00 

+2.922 

8.538084 

+  2  211954 

1906 

1907 

2.16 

+  1.007 

1.014049 

16.86 

+4.782 

22.867524 

+  4.815474 

1907 

1908 

1.37 

+0.217 

0.047089 

16.14 

+4.062 

16  499844 

+  0.881454 

1908 

1909 

0.74 

—0.413 

0.170569 

14.37 

+2.292 

5.253264 

—  0.946596 

1909 

1910 

0.50 

—0.653 

0.426409 

14.59 

+2.512 

6.310144 

-  1.640336 

1910 

1911 

6.14 

—1.013 

1.026169 

14.76 

+2.682 

7  193124 

—  2.716866 

1911 

S  (xy)  =  44.948884 
n  =  27 
Gx=  0.919 
cy=  2.768 


S  (xy) 
rz.o.r.  cr 


44.948884 
68.682384 


0.6544454 
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344.  Calculés  de  la  môme  façon,  les  coefficients  de  cor- 
rélation de  Xi  avec  X8  et  de  X2  avec  X8  ont  respectivement 
pour  expression  : 

r13  =  0,74992  =  0,98556 

La  formule  (68)  a  pour  objet  de  permettre  le  calcul  des 
corrélations  de  premier  ordre  et  de  leurs  valeurs.  Pour  y 
arriver,  il  faut  une  suite  assez  longue  d'opérations,  dont 
le  chercheur  disposera,  pour  plus  de  facilité,  les  résultats 
sous  forme  de  tableaux. 

La  détermination  de  1 — y2  donnerait  lieu  à  des  calculs  très 
longs;  heureusement  il  a  été  possible  de  construire  des 
tables  pour  le  calcul  de  la  valeur  de  1 — r2;  on  en 
trouvera  une  très  complète  dans  le  précieux  recueil  de 
Pearson  :  «  Tables  for  statisticians  and  biometricians  »  (1). 

Nous  cherchons  ensuite  les  logarithmes  de  (1—  r)  I  au 
moyen  de  la  table  de  Pearson  ;  en  employant  une  table  de 
logarithmes  à  7  décimales,  nous  arrivons  à  obtenir  pour 
chacun  des  r  dans  l'ordre  de  leur  énumération  : 

1,880-776  1,8-2048905  1,7988476 

Pour  connaître  le  numérateur  de  la  fraction,  on  fait 
d'abord  la  somme  des  produits  en  multipliant  entre  elles 
les  valeurs  des  r  restantes.  Ainsi,  nous  avons  pour  résultat  : 

0,7350  0,6370  0,4875 

valeurs  qu'il  faut  soustraire  des  expressions  corrélatives 
de  l'ordre  zéro,  de  sorte  qu'on  a  : 

—  0,1150  +  0,1130  +  0,4925 

Nous  déterminons  immédiatement  les  logarithmes  des 
numérateurs  : 

3,0606978  3,0565237  3,6924062 


(1)  Table  VIII.  Valeurs  de  1  —  ri  pour  r  =  0,001  à  0,990  (pp.  20-21  ), 
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Les  logarithmes  des  dénominateurs  doivent  être  recher- 
chés ensuite  :  le  logarithme  pour  r12  s'obtient  en  addition- 
nant les  logarithmes  de  r13  et  de  r23  et  de  même  pour  les 
autres  coefficients.  On  a  donc  : 


1,61933665 


1,6796236 


1,70126505 


Pour  avoir  les  logarithmes  de  corrélation  de  premier 
ordre,  on  soustrait  les  dénominateurs-  des  numérateurs  et 
l'on  obtient  : 

1,4413612  1,3769001  1,9911397 

lies  valeurs  de  ces  logarithmes  sont  : 

0,28  0,48  0,98 

On  calcule  en  dernier  lieu  les  logarithmes  de  r2  cor- 
respondant aux  coefficients  de  corrélation  de  la  colonne  8. 
A  cet  effet,  nous  utilisons  comme  la  première  fois,  les  tables 
de  Pearson  : 

log  0,921600  =  3,9645425;    log.  0,769600  =  3,8862651  ; 
log.  0,039600  =  2,59769519 


Tableau  du  calcul  de  la  corrélation  à  trois  variables 

(  M,  =  1,153  ;  M2  =  12,078;  M3  =  4,087 


Constantes 


o"!  =  0,9196;  ff2  =    2,768;  <r3  =  0,741 


r 
1 

log. 
1  — r2 

2 

Pro- 
duits 

•t 

Numé- 
rateur 

4 

Numérat. 
log 

s 

Dénumin. 
log. 

fi 

Corrt'laiion 
rie  1er  ordre 

log.     I  valeur 

î         1  H 

log.  (1/2) 
1  —  r* 

9 

1 

r„  =  0,65  1,880776 

L 

r13  =  0,75  1,82048905 

L 

riJ  =  0,98^1,7988476 

0.7350 
0.6370 
0  4875 

-  0  1150 
+  0  1130 
-f  0.4925 

3,0606978 
3,0565237 
£6924062 

Ï.61933665 
ï  6796236 
1. 70126505 

F.4413612  0.28 
Ï.3769001  0  48 
1.9911397  0  98 

î  98227125 
î.  94313255 
F.  29884759 

Ces  résultats  numériques  obtenus,  il  reste  à  en  donner 
l'interprétation. 
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345.  Dans  l'exemple  proposé,  nous  désignons  par  : 

(1)  Le  bénéfice  moyen  à  la  tonne; 

(2)  La  valeur  moyenne  à  la  tonne; 

(3)  Le  salaire  journalier  moyen  de  l'ouvrier  du  fond. 
Nous  essaierons  de  donner  une  interprétation  rationnelle 

des  coefficients  de  corrélation  de  l'ordre  zéro  et  du  pre- 
mier ordre.  Nous  avons  vu  que  : 

r12  =  0.65      r13  =  0.7o      r23  =  0.98 

Le  bénéfice  moyen  et  la  valeur  moyenne  à  la  tonne  (1), 
tout  en  accusant  une  corrélation  marquée,  sont  inférieurs 
au  degré  de  corrélation  montré  par  les  autres  éléments.  Ce 
résultat  est  conforme  à  l'observation,  car  lorsque  les  prix 
sont  élevés,  on  en  profite  généralement  pour  faire  des 
travaux  de  premier  établissement,  dont  le  coût  réduit  l'im- 
portance du  bénéfice. 

La  relation  entre  le  bénéfice  moyen  à  la  tonne  et  le  sa- 


li) La  râleur  à  la  tonne  est  le  quotient  de  la  division  de  la  valeur  globale 
du  charbon  extrait  par  le  nombre  de  tonnes  extraites.  La  valeur  à  la  tonne 
ne  représente  donc  pas  le  prix  de  vente  moyen,  car  une  partie  assez 
importante  de  la  production  est  consommée  par  les  charbonnages  eux-mêmes 
ou  cédée  à  leurs  ouvriers.  Ainsi,  en  1911,  la  production  totale  a  été  de 
23,053,540  tonnes,  dont  la  valeur  atteignit  340,278,800  francs,  ce  qui 
établit  la  valeur  moyenne  à  la  tonne  à  fr.  14.76.  D'autre  part,  il  y  a  lieu 
de  défalquer  de  ces  chiffres  2,263,670  tonnes  consommées  par  les  charbon- 
nages, d'une  valeur  de  20,082,100  francs  (fr.  8.87  la  tonne)  ce  qui  laisse 
apparaître  la  quantité  vendable  à  20,789,870  tonnes  et  sa  valeur  à  320,196,700 
francs  ou  fr.  15.40  la  tonne.  Ce  qu'on  appelle  valeur  moyenne  à  la  tonne 
indique  par  conséquent  le  résultat  brut  de  l'extraction. 

Le  salaire  journalier  moyen  de  l'ouvrier  du  fond  est  la  somme  nette 
payée  à  l'ouvrier  travaillant  au  fond  de  la  mine,  défalcation  faite  des 
retenues  prélevées  sur  les  salaires  pour  des  institutions  de  prévoyance, 
des  amendes,  fournitures  d'outils,  etc.,  divisée  par  le  nombre  de  journées 
de  présence  de  la  masse  des  ouvriers  du  fond.  Il  en  résulte  que  le  salaire 
journalier  moyen  n'est  pas  un  salaire  effectivement  gagné  par  des  ouvriers 
réels.  D'une  part,  il  réunit  tous  les  bassins,  il  confond  toutes  les 
exploitations  en  une  seule;  de  l'autre,  il  réunit  les  salaires  de  ceux 
qui  n'ont  travaillé  que  d'une  manière  irrégulière  aux  salaires  des  ouvriers 
qui  ont  travaillé  chaque  jour  et  même  ont  fait  des  heures  supplémentaires. 
C'est  une  pure  abstraction  dont  la  valeur  de  comparaison  est  seule  à 
retenir. 
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laire  moyen  est  plus-  fortement  marquée  :  0.75.  L'indice  de 
Fechner  (indice  de  dépendance)  donne  un  résultat  très  ap- 
proché: 0.724.  (Cfr.  p.  497.) 

La  relation  simple  entre  le  salaire  et  le  prix  de  vente  ap- 
paraît très  étroite,  au  point  qu'elle  se  rapproche  de 
l'unité  :  0.98. 

Les  coefficients  de  corrélation  du  premier  ordre  sont  les 
suivants  : 

r12.3  =  0.28  rJ3.2  =  0.48  r23#1  =  0.98 

La  signification  de  ces  coefficients  de  corrélation  est  que, 
pour  12.3,  le  bénéfice  moyen  et  la  valeur  moyenne  à  la  tonne 
étant  fonction  l'une  de  l'autre,  le  salaire  journalier  moyen 
étant  une  variable  indépendante,  leur  corrélation  est  la 
plus  faible  qui  existe.  Ainsi  donc,  si  l'on  considère  unique- 
ment ces  deux  éléments  :  la  valeur  à  la  tonne  et  le  bénéfice 
réalisé,  leur  union  apparaît  assez  étroite,  mais-  si  l'on  y  fait 
intervenir  le  salaire,  la  désunion  apparaît  aussitôt,  car 
l'élévation  du  bénéfice  à  la  tonne,  plus  les  autres  frais,  est 
en  raison  inverse  de  la  hauteur  du  salaire  dans  le  mode  de 
comptabilité  qui  a  été  adopté  par  l'administration  des 
mines;  or,  la  part  du  salaire  est  de  loin  la  plus  importante 
et  c'est  elle  surtout  qui  pèse  sur  le  reliquat  constituant  le 
bénéfice. 

r13.2  =  0.48  indique  que  le  bénéfice  moyen  à  la  tonne  est 
'en  relation  assez  étroite  avec  le  taux  du  salaire  journalier, 


Aux  salaires  s'ajoutent  les  frais  provenant  de  travaux  de  premier  établis- 
sement et  autres  frais,  en  supposant  que  les  immobilisations,  de  quelque  im- 
portance qu'elles  soient,  sont  amorties  immédiatement. 

Le  total  de  ces  dépenses  et  des  salaires,  déduit  du  produit  de  l'exploita- 
.tion,  constitue  le  bénéfice  global,  qui,  lui-même,  divisé  par  le  nombre  de 
tonnes  extraites,  donne  le  bénéfice  moyen  à  la  tonne.  Ce  bénéfice  n'est  pas 
le  même  que  celui  accusé  par  la  comptabilité  des  sociétés  charbonnières,  à 
cause  des  amortissements.  L'ensemble  de  ces  données  ne  représente  évidem- 
ment qu'une  valeur  de  comptabilité;  il  est  clair  que  d'autres  méthodes 
devraient  être  appliquées  pour  dégager  les  éléments  sociaux  des  problèmes 
considérés  (Cfr.,  par  exemple,  les  publications  de  l'Office  du  Travail  de 
Belgique  sur  les  salaires  dans  l'industrie  des  mines). 
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la  valeur  à  la  tonne  étant  considérée  comme  variable  indé- 
pendante. 

Mais  la  conjoncture  la  plus  favorable  se  présente  lorsque 
la  valeur  à  la  tonne  et  le  taux  du  salaire  sont  fonction  l'un 
de  l'autre,  le  bénéfice  moyen  étant  variable  indépendante; 
en  effet 

rgs.i  =  0.98 

Cette  corrélation  à  trois  variables  permet  d'arriver  à  une 
interprétation  intéressante  du  mode  de  variation  des  sa- 
laires dans  l'industrie  des  mines. 

Dans  une  page  lumineuse,  Em.  Waxweiler  a  décrit  le  mé- 
canisme de  ce  qu'il  appelle  «  le  conflit  des  évaluations 
dans  le  débat  du  salaire  (1)  ».  Au  fond,  le  débat  qui  s'agite 
entre  l'entrepreneur  et  le  salarié  chaque  fois  qu'il  devient 
nécessaire  de  fixer  le  taux  du  salaire  se  ramène  à  ceci  : 
pour  l'employeur,  le  temps  du  travail  doit  être  productif, 
pour  le  salarié,  il  doit  être  lucratif. 

Il  est  évident  qu'avant  tout,  les  parties  doivent  être  d'ac- 
cord sur  un  salaire  de  base  suffisant  pour  que  l'ouvrier 
consente  à  travailler.  La  somme  que  représente  ce  salaire 
est  variable  dans  l'espace  et  dans  le  temps;  elle  varie 
également  d'après-  la  catégorie  sociale  et  technique 
du  salarié.  La  somme  qui  déclenche  l'activité  d'un 
terrassier  n'est  pas  celle  qui  déterminera  un  mécani- 
cien ou  un  typographe  à  travailler  ;  dans-  une  même  indus- 
trie et  pour  le  même  métier,  le  salaire  courant  ne  sera  pas 
identique  en  Flandre  et  en  Wallonie.  Le  salaire  courant 
est  à  peu  près  celui  de  l'ouvrier  travaillant  à  l'heure  ou  à  la 
journée.  Mais  pour  le  salaire  aux  pièces  une  série  d'évalua- 
tions successives  viennent  modifier  le  taux  habituel.  Au  fond, 
le  salaire  aux  pièces  n'est  qu'un  salaire  au  temps  déguisé. 


(1)  Bulletin  de  la  classe  des  Lettres  et  des  Sciences  morales  et  politiqiies 
de  l'Académie  royale  de  Belgique,  Bruxelles,  Hayez,  1907,  page  147  et  sui- 
vantes. 
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L 'entrepreneur  a  pris  soin  d'étudier  ou  de  faire  étudier  com- 
bien de  pièces  un  ouvrier  moyen  peut  faire  durant  une  jour- 
née normale  et  il  a  fixé  le  prix  unitaire  de  chaque  pièce  en 
conséquence.  Le  salarié  acceptent  travaille,  mais  en  conser- 
vant par  devers  lui  une  certaine  réserve  de  son  activité. 
Peu  à  peu,  il  s'aperçoit  qu'en  disposant  ses  outils  de  telle 
façon  plutôt  que  de  telle  autre,  en  évitant  des  pertes  de 
temps,  en  adoptant  tel  tour  de  main  suggéré  par  l'habitude 
et  l'entraînement,  il  pourrait  augmenter  son  gain  journa- 
lier. Il  réalise  ces  réformes  et  son  salaire  hausse.  Dans  bien 
des  cas,  il  arrive  que  son  salaire  hausse  dans  des  propor- 
tions que  l'entrepreneur  n'avait  pas  prévues.  Or  l'entre- 
preneur avait  simplement  cherché  une  base  d'appréciation; 
cette  base  devient  trop  large;  il  réduit  le  taux  unitaire  de 
la  pièce,  ce  qui  semble  à  l'ouvrier  une  criante  injustice,  car 
l'entrepreneur  lui  semble  profiter  injustement  des  efforts 
qu'il  a  faits  pour  augmenter  sa  production. 

Cette  analyse  est  ingénieuse,  mais  elle  omet  de  mettre 
en  lumière  un  élément  d'une  importance  réelle  :  la  valeur 
marchande  du  produit  sorti  des  mains  de  l'ouvrier. 

Dans  le  travail  des  mines,  cette  valeur  est  aisément  con- 
nue. Il  n'en  est  pas  de  même  dans  les  usines  et  dans  les  ma» 
nufactures.  Celles-ci  produisent  des  centaines  d'articles 
différents  :  une  mine  n'en  produit  qu'un  seul  :  la  houille. 
La  valeur  de  la  tonne  est  aisément  connue  :  la  Bourse,  les 
journaux,  le  public  font  connaître  à  l'ouvrier  les  varia- 
tions du  prix  du  combustible.  Reprenons  à  présent  l'hypo- 
thèse initiale  de  M.  Waxweiler.  Supposons  fixée  la  somme 
initiale,  d'après  les  habitudes  de  la  région,  qui  déclenchera 
l'activité  de  l'ouvrier  mineur  Iravaillant  au  fond.  En  ad- 
mettant que  l'ouvrier  puisse  faire  tel  avancement  par  jour, 
le  prix  de  l'avancement  est  fixé.  Survient  une  hausse  du 
prix  du  charbon  due  à  des  demandes  plus  considérables  de 
l'industrie.  L'ouvrier  mineur  est  au  courant  de  cette 
hausse.  De  plus,  chaque  jour,  en  traversant  la  «  paire  », 
il  constate  que  les  stocks  de  charbon  diminuent  et  que  la 
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production  de  la  mine  s'écoule  au  fur  et  à  mesure  qu'elle 
arrive  au  jour.  Le  raisonnement  que  l'entrepreneur  se  fait 
lorsque  l'ouvrier  aux  pièces  arrive,  par  l'habitude,  à  dépas- 
ser d'une  façon  sensible  le  gain  prévu  lors  de  la  fixation  du 
prix  unitaire,  l'ouvrier  mineur  le  refait  en  sens  inverse  : 
la  base  admise  lors  de  la  solution  du  conflit  des  évaluations 
n'est  pas  assez  large,  elle  devrait  être  revisée,  le  prix  de 
l'avancement  sera  augmenté;  et  sans  augmenter  son  rende- 
ment, l'ouvrier  gagnera  un  salaire  plus  fort. 

Logiquement,  il  semblerait  que  les  prétentions  de  l'ou- 
vrier dussent  être  limitées  par  les  bénéfices  réalisés  par  le 
patron. 

Mais  au  moment  où  le  conflit  d'évaluation  éclate,  l'ou- 
vrier ne  connaît  pas  le  bénéfice  du  patron.  Et  l'entrepre- 
neur l'ignore  lui-même;  c'est  seulement  à  la  clôture  du 
bilan,  au  mois  d'avril  ou  de  mai  de  l'année  suivante,  que  le 
patron  connaîtra  le  bénéfice  laissé  par  l'exploitation.  C'est 
la  raison  pour  laquelle  dans  les  mines,  le  salaire  et  la  valeur 
à  la  tonne  sont  fonction  l'un  de  l'autre,  et  que  l'interven- 
tion du  bénéfice  comme  troisième  variable  ne  modifie  pas  la 
relation  existant  entre  ces  deux  éléments  :  la  corrélation  de 
l'ordre  zéro  est  en  effet  la  même  que  celle  du  premier 
ordre  :  0.98. 
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CHAPITRE  V. 


Statistique  graphique. 

1.  —  Définition  et  base  géométrique. 

347.  Jusqu'à  présent,  nous  avons  vu  la  statistique  faire 
usage  exclusivement  des  chiffres  pour  exposer  les  résul- 
tats qu'elle  obtient,  mais  il  existe  une  autre  méthode  qui  a 
recours  aux  figures  géométriques  pour  exposer,  comparer 
ou  rechercher  les  conclusions  de  l'investigation  scienti- 
fique :  c'est  la  statistique  graphique. 

Sans  l'aide  de  la  statistique,  les  phénomènes  collectifs 
resteraient  pour  nous  un  complexus  indéchiffrable,  car 
leur  infinie  variété  nous  interdirait  à  jamais  la  connais- 
sance de  la  norme  et  des  déviations  par  rapport  à  la  norme. 
La  statistique  graphique  vient  encore  compléter  les  acqui- 
sitions scientifiques  de  la  statistique  numérique  en  en  tra- 
duisant les  résultats  au  moyen  de  figures  géométriques  : 
pour  connaître  la  situation  d'un  groupe  de  salariés,  il  faut 
calculer  la  distribution  des  salaires  ;  c'est  l'œuvre  de  la  sta- 
tistique numérique  ;  puis  on  peut  tracer  la  courbe  de  cette 
distribution,  c'est  la  tâche  de  la  statistique  graphique. 

Les  raisons  de  recourir  aux  graphiques  sont  nom- 
breuses : 

1°  Les  chiffres,  pour  beaucoup  de  personnes,  sont  rebu- 
tants à  lire.  Cet  inconvénient  est  supprimé  ou  atténué  d'une 
manière  notable  si  on  leur  substitue  une  figure  géomé- 
trique simple  ou  une  courbe  statistique.  Les  figures  em- 
ployées par  la  statistique  graphique  sont  des  réalités  qui 
reposent  l'esprit  de  l'effort  d'abstraction  qu'il  doit  faire 
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pour  saisir  et  comprendre  les  nombres.  L'impression 
qu'elles  produisent  est  en  général  plus  vive  et  plus  durable  ; 

2°  Un  plus  grand  nombre  encore  de  personnes  éprouvent 
une  difficulté  spéciale  à  retenir  les  chiffres  ;  ce  n'est  que  par 
un  effort  dont  bien  peu  sont  capables  qu  'on  parvient  à  ap- 
précier avec  exactitude  les  relations  qu'ils  présentent  en- 
tre eux.  Les  courbes  statistiques  remplissent  à  cet  égard 
un  office  d'une  incontestable  utilité; 

3°  Les  longues  colonnes  de  chiffres  sont  remplacées  dans 
les  graphiques  par  une  figure  dont  l'allure  générale  se  dé- 
couvre d'un  seul  coup.  Cette  méthode  de  la  science  possède 
donc  un  pouvoir  de  représentation  synthétique  qui  n'appar- 
tient pas  aux  nombres  ; 

4°  Les  graphiques  sont  aussi  un  instrument  de  contrôle 
et  de  comparaison.  Bien  des  inexactitudes  passeraient  in- 
aperçues dans  les  séries  numériques  qui  se  décèlent  du  pre- 
mier coup  d'œil  dans  une  courbe.  Dans  un  grand  nombre  de 
cas  on  a  eu  recours  à  la  statistique  graphique  comme  à  un 
moyen  de  signaler  automatiquement  les  erreurs  du  relevé. 
Les  comparaisons  entre  deux  ou  plusieurs  faits  observés 
sont  aussi  rendues  plus  faciles  par  l'emploi  des  graphiques  ; 

5°  Les  procédés  graphiques  ont  aussi  un  rôle  dans  la  re- 
cherche scientifique  en  faisant  naître  l'hypothèse  néces- 
saire à  la  découverte  de  la  loi  :  <(  En  comparant  les  courbes 
de  plusieurs  faits  portés  sur  un  même  diagramme,  dit 
M.  Levasseur,  le  statisticien,  l'économiste,  le  moraliste  dé- 
couvrent souvent  dans  la  similitude  ou  dans  l'opposition 
des  mouvements  certains  rapports  qui  leur  avaient  échappé, 
d'autres  dont  ils  auraient  eu  peine,  sans  ce  secours,  à  ap- 
précier l'intensité  ou  la  périodicité  (1)  »  ; 

6°  Enfin,  on  peut  recourir  aux  graphiques  pour  calculer 


(1)  Levasseur,  «  La  Statistique  graphique  ».  (Jubilee  volume  of  the 
Statistical  Society,  London,  1885,  p.  248.) 
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certaines  données  au  lieu  d'employer  les  méthodes  numé- 
riques. 

En  résumé,  la  statistique  graphique  recherche,  démon- 
tre et  contrôle  les  résultats  des  phénomènes  soumis  aux  in- 
vestigations de  la  statistique.  Nous  trouvons  dans  ce  triple 
rôle  une  indication  au  sujet  de  la  division  de  notre  ma- 
tière :  nous  étudierons  successivement  les  graphiques  sous 
ce  triple  aspect  en  indiquant  les  méthodes  applicables  dans 
chaque  cas. 

348.  La  statistique  graphique  a  un  rôle  à  jouer  qui  lui 
appartient  en  propre;  elle  n'est  pas  la  servante  de  la  sta- 
tistique numérique,  mais  elle  ne  peut  prétendre  d'autre 
part  à  la  précéder  ou  à  la  dépasser.  De  toute  façon,  la  statis- 
tique doit  commencer  par  recueillir  les  unités,  les  compter, 
les  grouper,  les  peser;  c'est  elle  qui  fournit  aux  construc- 
teurs de  graphiques  la  matière  première  dont  ils  ont  besoin  ; 
la  statistique  numérique  peut,  à  la  rigueur,  se  passer  de  la 
statistique  graphique,  mais  celle-ci  ne  peut  rien  sans  le  con- 
cours de  la  première. 

Dans  un  avenir  plus  ou  moins  prochain,  les  documents 
statistiques  publiés  par  les  gouvernements  seront  devenus 
tellement  nombreux  que  les  chercheurs  éprouveront  de 
grandes  difficultés  à  se  les  procurer  tous  et  à  les  utiliser.  La 
statistique  rétrospective  deviendra  très  ardue  et  cependant 
son  emploi  sera  plus  indispensable  que  jamais.  Les  gra- 
phiques offriraient  un  moyen  commode  de  sortir  de  ces  em- 
barras :  il  suffirait  de  traduire  en  courbes  historiques,  les 
principaux  faits  se  rapportant  aux  années  antérieures  et  de 
faire  précéder  de  ces  graphiques  les  statistiques  nouvelles. 
Ainsi  le  présent  serait  relié  au  passé.  Cet  usage  des  gra- 
phiques aurait  l'avantage  de  supprimer  les  recherches  et  de 
désencombrer  les  bibliothèques,  double  bienfait  que  les 
chercheurs  de  l'avenir,  accablés  sous  le  fardeau  d'une  litté- 
rature scientifique  énorme,  apprécieront  de  plus  en  plus. 
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349.  Nous  avons  dit  plus  haut  que  les  graphiques  sont 
basés  sur  la  géométrie.  Bien  que  les  figures  employées 
soient  en  général  très  simples,  il  ne  sera  pas  inutile  de  re- 
prendre ici,  sous  une  forme  abrégée,  l'exposé  des  principes 
mathématiques  sur  lesquels  se  fonde  la  statistique  graphi- 
que; leur  rappel  est  nécessaire  pour  permettre  au  lecteur 
d'envisager  tous  les  cas  théoriques  et  pour  procéder  avec 
sûreté  dans  les  applications  diverses.  Les  traités  d'algèbre 
et  de  géométrie  analytique  contiennent  tous  l'exposé  de  la 
théorie  dont  nous  ne  faisons  ici  que  rappeler  les  traits  es- 
sentiels, le  lecteur  se  reportera  aux  traités  eux-mêmes  pour 
avoir  une  idée  plus- complète  des  principes  s'il  désire  appro- 
fondir la  matière. 


en  géométrie  analytique,  elles  se  coupent  à  un  angle  infé- 
rieur à  90°,  mais  il  n'y  a  là  aucune  différence  essentielle; 
celle  qui  vient  d'être  signalée  n'est  que  de  convention  et 
d'usage.  Ces  droites  sont  nommées  axe  des  ordonnées,  pour 
la  droite  YY'  placée  dans  le  sens  vertical,  axe  des  abscisses 
pour  la  ligne  XX'  dont  la  position  est  horizontale.  Le  point 
de  rencontre  des  deux  axes  est  désigné  par  la  lettre  0  et  est 
pris  par  convention  comme  origine  des  distances.  Par  le 
point  P,  on  mène  des  parallèles  aux  droites  XX'  et  YY',  les 
parallèles  à  ces  droites  s'arrêtent  au  point  A  sur  l'axe  des 
abscisses,  au  point  P>  sur  l'axe  des  ordonnées.  La  distance 
OB  est  appelée  ordonnée  du  point  P  et  la  distance  égale  P  A 


Fie.  31. 


Pour  fixer  la  position  d'un 
point  P  dans  un  plan,  il  suffit  de 
rapporter  la  position  de  P  à  des 
éléments  supposés  fixes  dans  le 
plan  même.  Dans  ce  but,  on  trace 
d'abord  deux  droites  XX'  et  YY' 
se  coupant  dans  ce  plan;  d'ordi- 
naire, en  statistique  graphique, 
les  deux  droites  en  question  se 
coupent  à  angle  droit  tandis 
que  dans  les  figures  employées 
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porte  le  même  nom;  la  distance  0  A  est  l'abcisse  de  P;  les 
longueurs  O  A  et  P  A  considérées  simultanément  sont 
les  coordonnées  du  point  P.  Il  suit  de  là  que  la  position 
d'un  point  P  dans  un  plan  est  connue  si  l'on  donne  ses 
coordonnées. 

350.  Les  données  provenant  du  relevé  sont  d'habitude 
toutes  de  nature  positive;  cependant  il  arrive  qu'on  re- 
cueille des  données  négatives,  inférieures  à  iun  niveau 
donné,  comme  les  indications'  du  thermomètre,  qui  sont  po- 
sitives ou  négatives  d'après  leur  position  par  rapport  à  0°; 
le  calcul  arrive  souvent  à  déterminer  des  données  négatives, 
comme  c'est  le  cas  pour  le  produit  (x  y)  dans  les  corréla- 
tions entre  données  groupées.  11  importe  donc  d'envisager 
la  position  des  valeurs  positives  et  négatives  dans 
le  plan.  On.  regarde  comme  positives  les  ordonnées 
mesurées  au-dessus  de  l'axe  XX'  et  comme  néga- 
tives celles  qui  sont  situées  au-dessous;  on  considère 
comme  positives  les  abcisses  comptées  à  droite  de 
l'axe  YY'  ert  comme  négatives  celles  qui  sont  portées  à 
gauche. 

Faisons  une  application  de 

ces  conventions  à  des  don-  r/ 

nées    positives    de   part    et        J  ( 

d'autre.    Soit    un    point    P         /  'p 

dont    les    coordonnées    sont  J 

égales  à  x  =  2,  y  =  3.  Une       2j  1 

unité  étant  adoptée  pour  la       J  j 

représentation    des    valeurs  / 

,  ol  ,  fx_  x 

numériques,  on  reporte  sur  i  l 

l'axe  O  X  deux  fois  cette  FlG  32 

valeur  et  on  la  compte  trois 

fois  sur  l'axe  O  Y;  les  parallèles  tirées-  de  ces  points 
x  y  se  coupent  en  un  endroit  qui  est  la  position  du  point  P. 
Les  données  étant  toutes  positives,  il  suffit  de  tra- 
cer   les    axes    seulement    jusqu'à    leur    origine  com- 
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mune  o;  cette  disposition  est  celle  qui,  d'ordinaire,  est 
admise  pour  les  diagrammes  orthogonaux. 

Supposons  le  cas  de  valeurs  positives  et  négatives  réu- 
nies et  ensuite  de  valeurs  négatives  accouplées. 

Soit  les  coordonnées  x  =  3,  y  —  —  3,  puis  les  coordon- 
nées x  —  —  2,  y  =  —  3.  La  figure  à  tracer  comporte  le  pro- 
longement des  axes  X  et  Y  au  delà  du  point  d 'origine  o.  La 
longueur  correspondant  à  l'unité  étant  admise,  —  on  porte 
sur  l'axe  X  à  droite  de  l'origine  o  (puisqu'il  s'agit  de  va- 
leurs positives)  une  longueur  égale  à  trois  fois  l'unité; 

puis  sur  l'axe  Y,  en  dessous 
de  o,  une  longueur  3;  me- 
nant ensuite  les  parallèles 
à  OX1?  OYx  on  les  voit  se 
couper  en  un  point  Q  qui 
correspond  aux  coordonnées 
x  =  3,  y  =  —  3. 

Pour  trouver  le  point  cor- 
respondant à  x  =  —  2,  y  = 
—  3,  on  porte  sur  XXX,  à 
gauche  de  l'origine  o,  une 
longueur  2  et  sur  YYt,  en 
dessous  de  XXt  une  lon- 
gueur 3;  les  parallèles  menées  comme  il  est  dit  ci-dessus, 
se  coupent  à  l'endroit  du  point  R  déterminé  par  les  coor- 
données x  =  —  2,  y  =  —  3. 

Supposons  le  cas  où  les  coordonnées  sont  égales  à  y  =  3, 
x  —  —  3,  nous  avons  à  mesurer  une  longueur  3  sur  les  X, 
à  gauche  de  l'origine  et  sur  l'axe  des  ordonnées  Y  une  dis- 
tance 3,  à  gauche  de  cet  axe.  Menant  les  parallèles  comme 
précédemment,  nous  trouvons  le  point  S  correspondant 
aux  coordonnées  y  —  3,  x  =  —  3. 
D 'où  il  suit  que  : 

Pour  deux  valeurs  positives  de  X  et  Y,  la  figure  se  trouve 
à  droite  au-dessus  de  l'axe  des  X. 


Fig.  33. 
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Pour  deux  valeurs  négatives-  de  X  et  Y,  la  figure  se 
trouve  à  gauche,  au-dessous  de  l'axe  des  X  ;  pour  une  valeur 
positive  et  une  valeur  négative  si  X  est  positif  et  Y  négatif 
la  figure  se  trouve  à  droite  et  au  dessous  de  l'axe  des  X; 
elle  se  trouve  à  gauche  et  au-dessus  de  l'axe  X  si  X  est 
négatif  et  Y  positif.  Les  principes  fixés  ci-dessus  règlent  la 
construction  des  diagrammes  orthogonaux. 

351.  On  peut  aussi  avoir  à  traduire  graphiquement  une 
fonction  algébrique  ou  trigonométrique.  Commençons  par 
exposer  le  mode  de  représentation  graphique  d'une  équa- 
tion du  premier  degré,  c'est-à-dire  l'équation  d'une  droite. 
Nous  examinerons  d'abord  le  cas  d'une  équation  du  pre- 
mier degré  à  une  inconnue. 

On  sait  par  l'algèbre  qu'on  peut  ramener  une  équation  du 
premier  degré  à  une  inconnue  à  la  forme 

■  b 
ax  =  o  ou  x  —  — 
a 

et  en  représentant  -  par  m,  nous  avons  : 

Cl 

x  =  m 

laquelle  équation  représente  une  droite  dont  tous  les  points 
ont  pour  abcisse  m;  la  ligne  formée  par  ces  points  succes- 
sifs est  donc  une  droite  parallèle  à  l'axe  de  Y.  Si  m  est 
positif,  on  porte  à  droite  de  l'origine  o  une  longueur  égale 
à  la  valeur  absolue  de  m  estimée  d'après  une  unité  conve- 
nue et  par  ce  point  on  mène  une  droite  parallèle  à  O  Y;  à 
gauche  de  l'axe  YYj  les  valeurs  de  m  sont  négatives.  Pour 
représenter  une  droite  parallèle  à  l'axe  des  XX1?  on  em- 
ploierait l'équation  y .  =  -f  b.  Lorsque  les  équations  sont  : 
y  =  0,x  =  0,  elles  représentent  l'axe  même  des  X  et  des  Y. 

352.  L'équation  de  la  droite  quand  il  s'agit  d'une  équa- 
tion du  premier  degré  à  deux  inconnues  est  un  peu  plus 
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compliquée.  Soit  a,  b,  c  des  quantités  connues  et  x,  y,  deux 
inconnues  ;  nous  avons  l'équation  de  la  forme  : 


bx  +  b 


ax  +  by  =  c  ou  y 
que  l'on  transforme  en 

y  =  mx  +  n 

Il  convient  d'abord  de  rechercher  le  lieu  géométrique  re- 
présenté par  l'équation.  Pour  le  trouver,  si  n  est  nul,  il 
suffit  de  déterminer  un  point  quelconque  et  de  tracer  la 
droite  qui  passe  par  ce  point  et  l'origine.  On  démontre  en 
effet  que  tous  les  points  A,  A',  A",  A'"  appartiennent  à 
une  même  droite  M  N  qui  passe  par  l'origine,  car  : 

Si  X  =  0  B  et  que  nous  prenons  une  longueur 

Y  =  BA 


on  a 


AB 
OB 


=  m 


et  A  est  un  point  du  lieu  géométrique  cherché. 

Si  l'on  donne  à  X  une  va- 
leur négative 

X  =  —  0  B' 
Prenant  Y  =  —  B'  A', 


on  a 


—  A'B' 

—  OB' 


m 


Fig.  M. 


et  A'  est  aussi  un  point  du 
lieu. 


On  procède  de  même  pour  A",  A'",  etc.,  et  l'on  obtient 
l'équation  : 


AB 
m=ÔB  = 


A'B' 
OB' 


A"R"  _  A"'B'' 
OB"  _  "0~F 


STATISTIQIT.  GRAPHIQUE 


et  tous  les  triangles  formés  par  les  points  A,  B,  0,  A',  B', 
0,  etc.,  sont  égaux  comme  ayant  un  angle  égal  compris 
entre  des  côtés  proportionnels. 

Si  n  n'est  pas  nul,  le  lieu  géométrique  sera  obtenu  en  aug- 
mentant ou  en  diminuant,  suivant  le  signe  de  n,  toutes  les 
ordonnées  de  la  valeur  absolue  de  n. 

Pour  trouver  les  points  où  la  droite  coupe  les  axes,  on 
fait  X  =  0,  la  valeur  correspondante  de  Y  donne  le  point 
où  la  droite  rencontre  l'axe  des  X;  si  Y  =  0,  la  valeur  cor- 
respondante de  X  indique  le  point  de  section  de  Y. 

Soit  : 


4r  +  by  =  12 


0, 


y  =  0,       x  =  3 


par  un  point  2  placé  sur  l'axe 
des  Y  on  fait  passer  une 
droite  qui  sectionne  l'axe  des 
X  au  point  3.  Cette  droite 
AB  est  la  droite  exprimant 
l'équation  ci-dessus. 


_x- 


Fig.  35. 


353.  Les  représentations 
graphiques  du  trinôme  du  se- 
cond degré  sont  d'un  usage 
très  fréquent  en  statistique. 
Avant  d'en  indiquer  la  technique,  il  est  utile  de  rappeler 
les  bases  mathématiques  sur  lesquelles  elle  repose. 

Soit  y  la  valeur  du  trinôme  du  second  degré 
j.2  _  4X  _j_  3 

Nous  posons  la  fonction  : 

y  =     —  4^  +  3 

Faisons  prendre  à  la  variable  x  différentes  valeurs.  Si, 
en  premier  lieu,  nous  écrivons  x  —  0,  il  est  évident  que 
y  =  -f  3.  Il  s'agit  d'une  valeur  positive  à  chercher  sur  l'axe 
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des  Y  en  se  servant  d'une  longueur  convenue  représenta- 
tive de  l'unité;  à  la  division  3,  mesurée  d'après  cette  unité, 
nous  marquons  le  point  A. 

Si  nous  admettons  x  =  -f  1,  nous  avons  évidemment 
y  =  o.  A  la  distance  admise  pour  l'unité,  nous  marquons 
le  point  B  sur  l'axe  des  X,  à  droite  de  l'axe  des  Y,  puisqu'il 
s'agit  d'une  valeur  positive  des  X;  les  coordonnées  de  B 
sont  X  =  +  1,  y  —  0. 

Faisons  encore  varier  X  et  admettons  X  =  +  2.  Dans  ce 
cas,  nous  avons  y  =  —  1;  par  une  perpendiculaire  à  l'axe 
des  X  ayant  son  origine  au  point  2  nous  posons  le  point  C 
à  une  distance  correspondant  a  —  1  sur  l'axe  des  Y;  les 
coordonnées  du  point  C  sont  :  x  ==  2,  y  —  —  1. 

Supposons  x  =  +  3,  il 
y  en  résulte  y  =  0,  point  re- 

présenté sur  l'axe  O  X 
par  B'  (coordonnées  x  = 
I  3,  y  =  0)  ;  pour  x  —  4, 

A  'A'  • 

/  on  obtient  :  y  =  -f-  3 

(A')  ;  pour  x  =  6  on  a,  y 
—  15,  etc.  Il  suffit  de  re- 

— y — » —  x'      lier  par  une  ligne  appro- 

'  priée  les  points  A,  B,  C, 

r  B',   A'   et   l'on  obtient 

FlG-  36-  ainsi  une  courbe  dont  les 

brandies  sont  infinies. 

La  forme  de  la  figure  dépend  de  la  nature  des  racines  du 
trinôme  :  si  les  racines  sont  réelles,  la  figure  conserve  la 
forme  indiquée  plus  haut  et  la  courbe  coupe  l'axe  des  X 
en  deux  points  marquant  les  racines  de  trinôme  ;  si  les  ra- 
cines sont  égales,  l'extrémité  de  la  courbe  est  tangente  à 
X  X';  si  elles  sont  imaginaires,  la  courbe  ne  touche  pas 
l'axe  des  XX'.  Ces  formes  géométriques  se  rencontrent  en 
statistique. 
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354.  Il  nous  reste  à  dire  quelques  mots  de  la  fonction 
trigonométrique  donnant  naissance  à  la  courbe  sinusoïdale. 
Les  faits  statistiques  exprimés  par  une  courbe  de  cette  na- 
ture sont  contenus  dans  les  séries  périodiques  :  ce  sont  les 
séries  qui  montrent  un  phénomène  observé  selon  les  divi- 
sions du  temps,  dont  les  fluctuations  maxima  et  minima  se 
présentent  à  des  intervalles  réguliers.  La  représentation 
analytique  de  ces  «  vagues  »  oblige  à  avoir  recours  à  des 
notions  trigonométriques  telles  que  le  sinus.  Le  lecteur  se 
rappelle  qu'en  trigonométrie  on  a  établi  la  convention 
suivante  :  toutes  les  lignes  trigonométriques  des  arcs  ter- 
minés dans  le  premier  quadrant  sont  positives,  les  lignes 
trigonométriques  des  arcs  terminés  dans  les  autres  qua- 
drants sont  positives  ou  négatives  suivant  qu'elles  ont  les 
mêmes  directions  que  les  lignes  de  même  nom  des  arcs  du 
premier  quadrant,  ou  des  directions  contraires.  De  quoi 
il  résulte  que  le  sinus  est  positif  dans  le  premier  et  le 
deuxième  quadrant  et  négatif  dans  les  deux  autres. 

Des  points  déterminés  d'après  les  règles  qui  précèdent,  il 
résulte  une  figure  périodique  dont  la  courbe  caractéristique 
porte  le  nom  de  courbe  sinusoïdale. 

355.  On  trouvera  la  table  complète  des  sinus,  degrés, 
minutes  et  secondes,  dans  les  traités  de  trigonométrie.  Pour 
tracer  la  courbe  sinusoïdale,  il  suffit  de  disposer  d'une 
table,  contenant  les  sinus  des  90  premiers  degrés  du  cercle. 
Le  lecteur  sera  à  même  de  construire  la  courbe  s'il  dispose 
d'une  table  donnant  simplement  les  sinus,  par  degrés.  Nous 
la  reproduisons  ci-après  : 
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Table  des  sinus  de  0°  à  90° 


DEGRÉS 

SINUS 

.  1 

DEGRES  j 

SINUS 

DEGRES 

SINUS 

0 

0.000 

30 

0.500 

60 

0  867 

1 

0.017 

31 

0.515 

61 

0.876 

2 

0.035 

32 

0.530 

62 

0  884 

3 

0  052 

33 

0  545 

63 

0.892 

4 

0  070 

34 

0  559 

64 

0  900 

5 

0.087 

35 

0  574 

65 

0.908 

6 

0  105 

36 

0.588 

66 

0.915 

7  . 

0.122 

37 

0.602 

67 

0  922 

8 

0.139 

38 

0.616 

68 

0  928 

9 

0.156 

39 

0.629 

69 

0.935 

10 

0.174 

40 

0.643 

70 

0.941 

11 

0.191 

41 

0  656 

71 

0  946 

12 

0  208 

42 

0  669 

72 

0.P52 

13 

0.225 

43 

0.682 

73 

0.957 

14 

0.242 

44 

0  695 

74 

0.962 

15 

0  259 

45 

0.T07 

75 

0.967 

16 

0.276 

46 

0  721 

76 

0.971 

17 

0.2'J2 

47 

0  733 

77 

0.975 

18 

0.309 

48 

0.745 

78 

0.979 

19 

0.326 

49 

0  757 

79 

0  982 

20 

0  342 

50 

0.768 

80 

0.985 

21 

0.358 

51 

0  779 

81 

0.988 

22 

0.375 

52 

0  790 

82 

0  991 

23 

0.391 

53 

0.800 

83 

0  993 

24 

0.407 

54 

0.811 

84 

0  995 

25 

0  423 

55 

0  821 

85 

0  996 

26 

0.438 

56 

0.831 

86 

0.998 

27 

0.454 

57 

0  840 

87 

0.999 

28 

0.469 

58 

0.850 

88 

0.999 

29 

0.485 

59 

0.859 

89 

1.000 

90 

1.000 

STATISTIQUE  GRAPHIQUE 


507 


356.  Pour  construire  la  courbe  sinusoïdale  nous  traçons 
un  axe  horizontal  0  X  sur  lequel  nous  portons  à  intervalles 
égaux  les  360  divisions  du  cercle;  en  ordonnées,  nous  por- 
tons les  divisions  de  l'unité  :  0.1,  0.2,  0.3,  etc.,  par  chaque 
point  de  Taxe  O  X  des  abcisses,  nous  élevons  des  perpendi- 
culaires d'une  longueur  égale  à  la  mesure  du  sinus  à  ce 
point  des  abcisses,  mesurée  sur  l'axe  O  Y  des  ordonnées.  De 
ce  qui  précède,  il  résulte  que  les  perpendiculaires  sont  pla- 
cées au-dessus  de  l'axe  O  X  (valeurs  positives)  pour  les 
deux  premiers  quadrants  et  au-dessous  de  l'axe  O  X  (va- 
leurs négatives)  pour  les  deux  derniers  quadrants.  On  ob- 
tient de  la  sorte  la  figure  reproduite  page  570,  qui  exprime 
théoriquement  la  courbe  des  phénomènes  dont  la  périodicité 
serait  idéale. 

II.  —  La  statistique  graphique  démonstrative. 

357.  On  distingue  dans  la  statistique  graphique  les  dia- 
grammes, les  cartogrammes  et  les  stéréogrammes. 

Les  diagrammes  sont  des  figures  construites  d'après  les 
procédés  géométriques. 

Les  cartogrammes  sont  des  cartes  géographiques  tein- 
tées ou  ombrées  selon  l'intensité  du  phénomène  à  repré- 
senter. : 

Les  stéréogrammes  sont  des  représentations  géométri- 
ques solides. 

Les  figures  les  plus  usuelles  sont  les  diagrammes;  par 
leur  variété,  ils  se  prêtent  à  une  quantité  d'usages;  leur 
précision  les  rend  aptes  à  exprimer  des  relations  mathéma- 
tiques délicates  et  compliquées.  Ils  forment  la  partie  la  plus 
importante  de  la  statistique  graphique  et  en  sont  comme 
l'essence. 

Les  cartogrammes  ne  peuvent  cependant  être  négligés. 
Leur  emploi  est  requis  chaque  fois  qu'il  convient  de  lier  à 
l'expression  numérique  d'un  fait  l'idée  de  sa  localisation 
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géographique;  ils  sont  un  moyen  intuitif  excellent  d'ap- 
prendre la  géographie  économique. 

Le&  stéréogrammes  ou  solides  sont  moins  employés  à 
raison  de  leur  complication;  les  spécialistes  peuvent  seuls 
y  recourir  avec  fruit  et  ils  se  prêtent  mal  à  l'enseignement. 

A.  —  Diagrammes. 

358.  Les  diagrammes  comprennent  un  grand  nombre  de 
figures.  -Parmi  elles,  on  distingue  les  figures  représentatives 
simples  (carré,  rectangle,  cercle)  et  les  diagrammes  ortho- 
gonaux dont  le  fondement  géométrique  a  été  exposé 
plus  haut.  Lorsque  les  diagrammes  orthogonaux  s'ap- 
pliquent à  des  faits  observés  à  certains  intervalles  de 
temps  et  que  ces  intervalles  sont  portés  sur  l'axe  des  ab- 
cisses  tandis  que  la  mesure  de  1  intensité  ou  de  la  densité 
des  variables  est  indiquée  sur  l'axe  des  ordonnées,  ils 
portent  le  nom  de  diagrammes  de  succession,  ou  «  histori- 
grammes  ».  Quand  les  graphiques  traduisent  les  données 
d'une  table  de  contingence  et  que  les  variables  sont  por- 
tées, les  unes  sur  les  ordonnées,  les  autres  sur  les  ab- 
cisses,  ils  sont  appelés  soit  diagrammes  ou  polygones  de 
fréquence,  soit  histogrammes  ;  ce  dernier  terme  a  été  intro- 
duit en  1896  par  le  professeur  Pearson  (1).  Les  courbes 
dont  il  s'agit  sont  basées  sur  le&  nombres  simples;  il  en  est 
d'autres  qui  dérivent  des  logarithmes  de  ces  nombres  et 
que  pour  cette  raison  on  appelle  «  courbes  logarithmiques  ». 

Enfin,  certains  diagrammes  ont  une  base  mathématique 
différente  de  celle  des  diagrammes  orthogonaux,  ils  portent 
le  nom  de  «  diagrammes  polaires  ». 

Les  divisions  introduites  dans  le  présent  exposé  suivent 
les  distinctions  ci-dessus. 


(1)  K.  Pearson,  «  Skew  variations  in  homogeneous  material  ».  Phil. 
Trans.  Roy.  Soc,  1896. 
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A.  —  Figures  représentatives  simples. 

359.  Les  diagrammes  représentatifs  simples  com- 
prennent les  procédés  ci-après  décrits  : 

1°  Le  point.  Le  mode  figuratif  par  le  point  consiste  es- 
sentiellement à  disposer  dans  un  certain  ordre,  des  points 
ou  petits  cercles  dont  chacun  représente  une  unité  statis- 
tique ou  un  nombre  convenu  d'unités.  En  tant  que  procédé, 
ce  mode  de  représentation  ressemble  au  diagramme  de  sur- 
face et  peut  être  avantageusement  remplacé  par  celui-ci. 

2°  La  ligne.  On  emploie  soit  une  simple  droite,  soit  des 
rectangles  allongés  dont  la  base  est  uniforme  et  dont  la 
hauteur  seule  varie  (tuyaux  d'orgue).  Pour  ce  diagramme, 
on  commence  par  déterminer  un  rapport  conventionnel 
entre  l'unité  métrique  et  une  certaine  quantité  de  faits  à 
représenter,  mais  il  n'est  expressif  que  pour  la  comparai- 
son avec  une  autre  ligne  ;  ainsi,  la  longueur  kilométrique  du 
réseau  de  chemin  de  fer  d'une  série  de  pays,  chaque  réseau 
étant  représenté  par  une  ligne  d'une  longueur  proportion- 
nelle à  l'étendue  kilométrique.  Veut-on  exprimer  un  ensem- 
ble qui  se  compose  de  deux  parties  distinctes?  on  emploie  un 
trait  plein  pour  une  partie,  un  trait  pointillé  pour  l'autre; 
on  peut  aussi  se  servir  de  rectangles  dont  les  parties  sont 
diversement  ombrées.  Si  l'on  admet,  par  exemple,  que  la 
longueur  du  réseau  ferré  comprend  les  lignes  d'intérêt  local 
(chemins  de  fer  vicinaux)  aussi  bien  que  les  lignes  d'intérêt 
général,  on  peut  réserver  à  chaque  fait  une  longueur  pro- 
portionnelle à  son  importance.  Les  lignes  exploitées  par  des 
compagnies  et  celles  exploitées  par  l'Etat  pourraient  aussi 
être  distinguées  les  unes  des  autres. 

3°  Les  surfaces.  Au  lieu  de  représenter  les  faits  par  de 
simples  droites  ou  des  rectangles  allongés,  il  est  possible 
d'en  figurer  la  grandeur  relative  au  moyen  de  surfaces  : 
deux  éléments  se  trouvent  ici  à  notre  disposition,  la  Ion- 
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gueur  et  la  largeur,  de  sorte  que  la  précision  de  la  figure 
est  augmentée  en  même  temps  que  son  pouvoir  représen- 
tatif. 

Commençons  par  éliminer  de  ce  groupe  une  figure,  le 
triangle  isocèle,  que  certains  statisticiens  avaient  cru  pou- 
voir proposer  pour  exprimer  les  rapports  de  nombres  sen- 
siblement différents;  la  difficulté  de  se  rendre  compte  de 
la  valeur  respective  de  surfaces  ayant  une  base  inégale  a 
fait  rejeter  l'emploi  de  cette  figure,  en  vertu  du  principe 
que  la  clarté  de  la  représentation  est  la  première  condition 
d'un  graphique  bien  établi. 

Les  figures  de  surface  les  plus  usuelles  sont  le  rectangle, 
le  carré  et  le  cercle. 

On  se  sert  des  carrés  et  des  rectangles  soit  pour  compa- 
rer entre  elles  des  données  se  rapportant  à  des  faits  diffé- 
rents, soit  pour  mesurer  l'importance  de  faits  ayant  entre 
eux  des  rapports  étroits.  Dans  ce  dernier  cas,  les  carrés  ou 
les  rectangles  les  plus  petits  sont  inscrits  dans  le  plus 
grand  :  dans  l'autre  cas,  les  figures  sont  séparées. 

Les  rectangles  servent  communément  à  indiquer  deux 
dimensions,  dont  l'une  est  mesurée  par  leur  base  et  l'autre 
par  leur  hauteur.  Ils  peuvent  même  servir  à  représenter 
trois  valeurs  si  l'on  admet  que  la  troisième  est  fonction  des 
deux  premières  :  ainsi,  on  pourra  figurer  au  moyen  d'un 
rectangle  le  nombre  de  journées  de  travail  le  long  du  rec- 
tangle, le  salaire  quotidien  à  la  base,  la  somme  payée  en  sa- 
laires (aire).  Le  carré,  dont  les  côtés  sont  égaux,  est  beau- 
coup moins  expressif  que  le  rectangle. 

En  général,  il  n'est  pas  aisé  de  comparer  l'aire  de  deux 
carrés  ou  de  deux  rectangles  dont  les  côtés  varient;  on 
éprouve  la  même  difficulté  à  l'égard  des  aires  des  cercles. 
Aussi,  réserve-t-on  généralement  le  cercle  pour  figurer  des 
données  dont  l'ensemble  forme  un  total:  par  exemple  la  ré- 
partition de  la  population  d'un  pays  par  sexe,  par  groupes 
d'âges,  par  divisions  professionnelles,  etc.  Chaque  partie 
est  d'abord  comparée  à  l'ensemble  et  son  importance  rela- 
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tive  est  exprimée  par  rapport  à  cent  :  on  prend  ensuite  sur 
la  circonférence,  une  longueur  proportionnelle  (100=360°). 
Les  différents  secteurs  sont  ombrés  ou  coloriés  de  manière 
à  les  distinguer  facilement  les-  uns  des  autres. 

360.  Les  diagrammes  de  longueur  et  de  surface  sont  fré- 
quemment employés  dans  les  ouvrages  de  vulgarisation  et, 
depuis  quelques  années,  dans  les  livres  scolaires,  particuliè- 
ment  dans  les  manuels  de  géographie.  On  en  a  fait  aussi 
un  usage  qu'on  peut  trouver  surabondant  dans  les  exposi- 
tions générales  et  spéciales  :  des-  sections  entières,  comme 
celle  d'économie  sociale,  ne  sont  formées  que  de  graphi- 
ques, le  plus  souvent  des  diagrammes  simples,  dans  la  con- 
fection desquels  les  dessinateurs  se  sont  ingéniés  à  mettre 
le  plus  de  variété  et  de  pittoresque  possible,  non  sans  détri- 
ment parfois  pour  l'exactitude  de  leurs  figures.  Il  est  per- 
mis de  voir  quelque  exagération  dans  la  mode  qui  s  'est  in- 
troduite de  vouloir  substituer  aux  chiffres  des  figures  géo- 
métriques plus  ou  moins  heureusement  combinées.  Le  plus 
souvent,  le  diagramme,  surtout  celui  basé  sur  les  figures 
simples,  reste  inférieur  à  la  donnée  chiffrée  parce  qu'il  lui 
est  impossible  d'atteindre  la  même  précision  :  hormis  des 
cas  très  rares,  où  il  s'agit  d'unités  en  nombre  restreint,  il 
n'est  pas  possible  de  faire  varier  un  diagramme  jusqu'à  la 
dernière  unité  et  si  les  unités  sont  peu  nombreuses  l'utilité 
du  diagramme  semble  douteuse.  Cette  infériorité  qui  tient 
à  la  nature  du  diagramme  se  compense,  il  est  vrai,  par  la 
vivacité  de  l'impression  visuelle,  supérieure  chez  beau- 
coup de  personnes  à  l'excitation  mentale  produite  par  les 
chiffres  ;  il  convient  de  tenir  compte  de  ce  fait,  tout  en 
évitant  l'abus  du  diagramme. 

Ne  serait-on  pas  d'avis  qu'il  y  a  abus  du  diagramme 
quand  celui-ci  vise  à  remplacer  des  données  numériques 
simples  qui,  tout  aussi  aisément  que  les  figures,  peuvent  se 
graver  dans  la  mémoire?  Serait-il  plus  difficile  de  retenir 
qu'en  1900-1901  la  Grande-Bretagne  comptait  41  millions 
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d'habitants,  l' Autriche-Hongrie  45  millions  et  l'Empire 
allemand  56  millions  que  si  l 'on  représente  ces  nombre»  par 
des  carrés  ou  des  rectangles  d 'une  grandeur  proportion- 
nelle? Serait-ce  alléger  la  tâche  de  la  mémoire;  que  d'obliger 
le  lecteur  à  retenir  que  ces  nombres  peuvent  être  représen- 
tés graphiquement  par  des  carrés  ayant  respectivement 
6  cent.  4  mm.,  6  cent.  7  mm.  et  7  cent.  48  mm.  de  côté?  De 
part  et  d'autre  il  s'agit  de  données  numériques  à  confier  à 
la  mémoire  et  les  secondes  sont  moins  parlantes,  moins  sug- 
gestives que  les  premières. 

Il  y  a  abus  encore  quand  le  graphique  s'éloigne  des 
formes  simples  et  mathématiques  pour  tomber  dans  les 
modes  de  représentation  compliqués  ou  de  pure  fantaisie. 
L'essentielle  qualité  d'un  graphique  est  d'être  clair,  ce  qui 
exclut  la  complication  voulue;  son  second  mérite  est  d'être 
exact,  ce  qui  écarte  l'emploi  des  ornements  d'imagination. 
Nous  ne  goûtons  que  médiocrement  le  procédé  de  ces  géo- 
graphes qui  représentent  le  tonnage  des  flottes  marchandes 
par  une  suite  de  vaisseaux  de  plus  en  plus  grands,  la  puis- 
sance des  armées  par  une  ligne  de  soldats  pygmées  au  dé- 
but, géants  à  l'autre  extrémité,  la  production  de  la  laine 
ou  du  coton  par  des  balles  de  marchandises  de  plus  en  plus 
grosses.  Tout  d'abord,  nous  n'apercevons  pas  la  raison 
pour  laquelle  ces  figures  emblématiques  se  graveraient 
mieux  dans  la  mémoire  que  les  simples  données  numériques 
qu'elles  expriment,  d'ailleurs  avec  une  précision  très  rela- 
tive. Et,  en  second  lieu  leur  exactitude  est  souvent  sujette 
à  caution  :  des  vaisseaux,  des  hommes,  des  ballots  sont  des 
solides,  or,  il  n'est  pas  certain  du  tout  que  le  dessinateur 
en  tienne  toujours  compte  pour  établir  ses  figures. 

Bien  que  la  recommandation  puisse  paraître  superflue, 
nous  notons  ici  que  pour  comparer  entre  elles  des  aires  de 
surface,  il  faut  établir  les  dimensions  de  ces  aires  dans  le 
rapport  des  racines  carrées  des  aires  elles-mêmes  s 'il  s 'agit 
de  surfaces,  et  dans  le  rapport  des  racines  cubiques  s'il 
s'agit  de  volumes. 
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B.  —  Diagrammes  orthogonaux. 
1°  Diagrammes  de  succession  ou  historigrammes. 

361.  Lorsqu'un  phénomène  est  étudié  en  relation  avec  le 
temps  et  que  les  divisions  du  temps  forment  les  points  de 
distribution,  on  a  ce  qu'on  appelle  une  série  historique  : 
c'est  l'histoire  d'un  fait  résumé  par  dates  et  par  chiffres. 
Au  diagramme  qui  reproduit  ces  données  en  portant  en  or- 
données les  nombres  et  en  abcisses  les  divisions  du  temps, 
on  a  donné  le  nom  d'historigramme.  Les  auteurs  français 
n'ont  pas  adopté  cette  dénomination,  qui  vient  de  l'école 
anglaise;  ils  ont  donné  à  ces  diagrammes  le  nom 
de  diagramme»  de  succession  parce  qu'ils  marquent  la 
façon  dont  un  fait  succède  à  un  autre  fait.  Nous  ne  voyons 
pas  de  raison  de  donner  la  préférence  à  un  terme  plutôt 
qu'à  l'autre,  c'est  pourquoi  nous  les  emploierons  chacun 
indifféremment. 

Le  diagramme  de  succession  ou  historigramme  est  le  pro- 
cédé le  plus  utile  que  la  statistique  graphique  mette  à  notre 
disposition  pour  analyser  les  phénomènes  complexes.  Une 
longue  série  numérique  défie  pour  ainsi  dire  l'analyse,  à 
moins  de  recourir  à  des  procédés  compliqués  que  nous 
avons  exposés  plus  haut.  Au  contraire,  le  tracé,  même  ca- 
pricieux, d'un  graphique  forme  un  schéma  que  l'analyse 
atteint  bien  plus  aisément  que  les  chiffres. 

La  théorie  des  diagrammes  orthogonaux  est  celle  de  la 
détermination  d 'un  point  dans  un  plan,  que  nous  avons  ex- 
posée plus  haut,  y  compris  la  théorie  de  la  courbe  sinu- 
soïdale qui  s'applique  aux  phénomènes  périodiques.  Ces 
exposés  bien  que  sommaires,  sont  suffisants  pour  envisa- 
ger la  question  sous  son  aspect  théorique;  aussi  nous  pla- 
çons-nous à  présent  au  point  de  vue  technique  et  pratique. 


362.  Pour  mieux  faire  ressortir  l'utilité  spéciale  des 
diagrammes  à  l'égard  des  séries  historiques,  il  est  désirable 
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de  procéder  à  une  application.  Nous  reprendrons  les  don- 
nées d'un  exemple  déjà  utilisé  précédemment:  le  bénéfice 
moyen  à  la  tonne  réalisé  par  les  charbonnages  de  Belgique 
de  1885  à  1915.  Voici  ces  données  : 


Exemple  1.  —  Bénéfice  moyen  à  la  tonne,  de  1885  à  1915, 
réalisé  par  les  charbonnages  en  Belgique 

{matériel  extrait  des  rapports  annuels  de  l'Administration  des  Mines) 


Années 

Bénéfice 
à  la  tonne 

Années 

Bénéfice 
à  la  tonne 

Années 

Bénéfice 
à  la  tonne 

1885 

0  40 

1895 

0.40 

1905 

0.83 

1886 

0.30 

1896 

0.52 

1906 

1.91 

1887 

0.48 

1897 

0.90 

1907 

2.16 

1888 

0.65 

1898 

1.05 

1908 

1.37 

1889 

1.11 

1899 

1.71 

1909 

0.74 

1890 

2.84 

1900 

4.26 

1910 

0.50 

1891 

1.82 

1901 

2.33 

1911 

0.14 

1892 

0.60 

1902 

1.41 

1912 

0.34 

1893 

0.33 

1903 

1.23 

1913 

0.83 

1894 

0.40 

1904 

0.75 

1914 

0.63 

1915 

0.75 

Nous  portons  sur  l'axe  des  abcisses,  à  des  intervalles 
égaux,  les  divisions  du  temps,  c'est-à-dire  daus  le  cas  ac- 
tuel, les  années.  Les  données  mêmes  de  la  série  sont  rele- 
vées d'après  cette  division  et  il  n'y  a  place  ici  pour  aucun 
choix.  Il  n'en  est  pas  de  même  en  ce  qui  concerne  l'unité 
de  valeur  :  le  bénéfice  moyen  à  la  tonne  varie  dans  des 
limites  très  étendues,  puisque  nous  le  voyons  à  fr.  4.26  en 
1900  et  à  fr.  0.14  en  1911.  La  moyenne  annuelle  se  fixe  à 
fr.  1.806.  Pour  mieux  observer  la  grandeur  des  oscillations 
nous  adoptons  pour  unité  des  ordonnées  la  valeur  de 
fr.  0.50;  partant  de  zéro  au  point  d'origine,  nous  portons 
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sur  l'axe  des  ordonnées  autant  de  divisions  qu'il  en  faut 
pour  atteindre  la  somme  maximum  de  fr.  4.26.  De  chaque 
division  de  l'axe  des  abcisses  nous  situons  un  point  dont  la 
hauteur  correspond  au  bénéfice  de  l'année  d'après  la  gra- 
duation portée  sur  l'axe  des  ordonnées  :  nous  complétons 
le  diagramme  en  reliant  tous  ces  points  par  des  droites 
dont  l'ensemble  forme  une  ligne  brisée. 


T.C.t.so 


Fig.  38. 

Le  graphique  fait  apparaître  les  traits  essentiels  du  phé- 
nomène beaucoup  mieux  et  surtout  beaucoup  plus  vite  que 
ne  le  fait  le  tableau  numérique.  Au  premier  coup  d'œil 
«'aperçoivent  trois  pics,  séparés  par  des  dépressions  plus 
ou  moins  profondes  :  le  pic  compris  entre  les  années 
1889-1891,  avec  son  sommet  en  1890  ;  un  massif  central  plus 
important  limité  par  les  années  1898  et  1902  dont  le  som- 
met, très  élevé,  se  place  en  1900  ;  une  pyramide  moins  éle- 
vée que  les  sommets  précédents  comprise  entre  1905  et  1908 
avec  son  maximum  en  1907.  Les  dépressions  extrêmes  se 
remarquent  en  1886,  1893,  1904  et  1914.  Les  bénéfices  des 
charbonnages  en  1900  ont  atteint  à  peu  près  cent  millions 
de  francs.  La  courbe  correspond  en  gros  aux  années 
grasses  et  aux  années  maigres  de  la  situation  économique 
générale.  Il  y  a  cependant  une  restriction  à  apporter  à  cette 
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conclusion:  elle  provient  de  ce  que,  pour  établir  le  bénéfice 
net  des  charbonnages,  base  de  la  redevance  proportionnelle 
des  mines,  l'administration  porte  en  compte  chaque  année 
toutes  les  dépenses!,  savoir,  les  dépenses  extraordinaires 
aussi  bien  que  les  frais  courants  de  l'exploitation.  Le  mon- 
tant des  installations  nouvelles  vient  donc  diminuer,  d'une 
manière  un  peu  factice,  les  bénéfices  des  charbonnages  (1). 

363.  La  construction  des  graphiques  orthogonaux  sou- 
lève différents  problèmes  techniques  d'une  solution  parfois 
délicate. 

Dans  les  diagrammes  de  succession  ou  historigrammes, 
les  divisions  du  temps  sont  portées  sur  l'axe  des  abeisses. 
Ces  divisions  doivent  être  égales,  mais  rien  n'est  fixé  quant 
à  leur  étendue.  Tout  ce  qu'on  peut  dire  à  cet  égard,  c'est 
que  la  précision  du  diagramme  est  d'autant  plus  grande 
que  la  division  du  temps  adoptée  pour  mesurer  est  petite. 
Supposez  qu'un  observateur  dresse  un  relevé  de  la  tempé- 
rature heure  par  heure;  le  diagramme  dont  l'unité  temps 
serait  l'heure  serait  beaucoup  plus  précis  que  celui  dressé 
par  vingt-quatre  heures.  Mais  le  statisticien  n'est  pas  tou- 
jours libre  d'adopter  une  échelle  du  temps  aussi  précise 
qu'il  le  voudrait.  Ou  bien  les  matériaux  réunis  par  d'autres 
lui  sont  remis  tout  préparés  et  il  n'est  pas  en  son  pouvoir 
de  les  modifier  ;  ou  bien,  s 'il  les  réunit  lui-même,  la  crainte 
de  compliquer  le  relevé  ou  d'imposer  au  public  une  gêne 
trop  grande  fait  donner  la  préférence  à  une  unité  de  temps 
assez  étendue. 

Le  résultat  d'une  investigation  quelconque  arrêtée  à  une 
date  déterminée  est  ou  une  moyenne  ou  un  total,  ou  une 
observation  particulière  faite  à  cette  date  même.  Ce  dernier 
résultat  est  le  plus  précis  qu'on  puisse  obtenir,  mais  dans 
les  sciences  économiques  et  sociales  il  est  rare  que  l'on 
puisse  s'en  contenter.  Pour  exprimer  la  continuité  des  phé- 


(1)  Statistique  générale  de  la  Belgique.  «  Exposé  de  la  situation  du 
Royaume,  de  1876  h  1900  ».  vol.  III,  p.  220,   Bruxelles,  1914. 
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nomènes  sociaux,  il  faut  nécessairement  recourir  aux 
moyens  de  représenter  cette  continuité  :  la  moyenne  qui  est 
un  partage,  la  totalisation  qui  est  une  accumulation.  La 
droite  tracée  hypothétiquement  d'une  année  à  l'autre  pour 
réunir  les  sommets  des  ordonnées  est  donc  bien  sujette  à 
caution,  et  elle  l'est  d'autant  plus  que  les  intervalles  sont 
espacés. 

Si  telle  est  l'exigence  théorique,  il  ne  faut  pas  oublier 
que  l'avantage  principal  du  graphique  consiste  dans  sa 
puissance  de  concentration.  A  vouloir  trop  préciser  on  ris- 
querait d'atténuer  la  valeur  du  schéma  graphique.  La  fa- 
culté de  résumer  en  une  simple  impression  visuelle  toute 
une  situation  n'appartient  qu'à  la  statistique  graphique. 
En  jetant  les  yeux  sur  le  diagramme  de  la  page  578  on 
aperçoit  du  même  coup  les  trois  périodes  d'augmentation 
des  bénéfices,  les  époques  de  dépression,  les  années  les  plus 
favorables  et  les  plus  mauvaises,  on  sait  juger  de  l'impor- 
tance relative  de  ces  trois  périodes  de  hausse,  de  la  gran- 
deur de  l'intervalle  qui  les  sépare,  de  leur  durée,  etc.  Pour 
dégager  des  tableaux  de  chiffres  une  impression  aussi  com- 
plexe, il  faudrait  beaucoup  de  temps  ;  le  diagramme  au  con- 
traire nous  la  fait  apparaître  en  un  instant. 

364.  Les  considérations  qui  précèdent  s'appliquent,  dans 
leur  ensemble,  aux  ordonnées  comme  aux  abcisses,  cepen- 
dant l'échelle  des  ordonnées  est  en  général  plus  précise, 
c'est-à-dire  plus  détaillée  que  l'échelle  des  abcisses.  Les 
mesures  quantitatives  procèdent,  d'ordinaire,  par  unités, 
alors  qu'il  est  rare  de  voir  adopter  des  divisions  du  temps 
plus  courtes  que  l'année. 

La  question  la  plus  délicate  soulevée  par  la  construction 
des  diagrammes  orthogonaux  est  le  rapport  à  établir  entre 
les  intervalles  des  axes  X  et  Y.  Si  les  divisions  de  X  (ab- 
cisses) sont  largement  espacées,  alors  que  celles  de  Y  (or- 
données), sont  resserrées,  la  courbe  s'étale  paresseuse- 
ment et  ses  «  vagues  »  ressemblent  aux  flots  tranquilles 
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d'un  fleuve  de  plaine.  Avec  la  convention  contraire;,  les  pics 
se  hérissent,  les  sommets  se  dressent,  les  dépressions  se 
creusent  comme  les  lignes  tourmentées  de  crêtes  monta- 
gneuses à  l'aspect  chaotique.  Les  rapports  mathématiques 
sont  restés  les  mêmes,  mais  l'allure1  du  diagramme  est  toute 
différente.  Le  premier  donne  l'impression  d'une  succession 
de  phénomènes  sans  surprise  ou  à-coups,  le  second  éveille 
l'idée  d'une  suite  de  faits  extrêmement  accidentée,  presque, 
de  cataclysmes.  L'Institut  international  de  statistique,  sur 
le  rapport  du  Dr  Jacques  Bertillon,  a  recommandé  d'adop- 
ter des  échelles  telles  que  l'allure  moyenne  du  phénomène 
corresponde,  pour  la  tangente  de  la  courbe,  à  une  inclinai- 
son de  45°.  En  même  temps  il  a  signalé  l'inconvénient  qu'il 
y  a  à  couper  la  partie  inférieure  du  diagramme  comme  on, 
le  fait  souvent  sous  prétexte  qu'elle  est  inutile;  cette  sup- 
pression arbitraire  fausse  le  diagramme  en  faisant  croire 
que  les  variations  de  la  fonction  sont  plus  importantes 
qu'elles  ne  le  sont  réellement  (1). 

365.  L'étude  des  conventions  relatives  aux  rapports  à 
établir  entre  les  abeisses  et  les  ordonnées  a  été  reprise  par 
l'Institut  international  de  statistique  dans  une  de  ses  ses- 
sions ultérieures.  Comme  le  fait  observer  le  rapporteur, 
M.  L.  March,  tout  jugement  porté  sur  la  variation  relative 
des  ordonnées  dépend  avant  tout  du  rapport  qui  existe 
entre  l'unité  de  mesure  des  abeisses  et  l'unité  de  mesure 
des  ordonnées.  Si  les  phénomènes  représentés  sont  de  même 
nature,  il  est  facile  de  tracer  toutes  les  courbes  d'après  la 
même  échelle  :  elles  seront  alors  exactement  comparables 
entre  elles.  Il  n'en  est  pas  de  même  si  l'on  a  à  comparer 
des  courbes  se  rapportant  à  des  phénomènes  de  nature  dif- 
férente. Cette  question  des  comparaisons  sera  étudiée  plus 
loin.  (Cfr.  III  :  La  statistique  graphique  comparative.)  Pour 


(])  Institut  international  de  statistique,  VIIIe  session.  «  Propositions 
relatives  à  l'uniformité  à  apporter  dans  l'établissement  des  graphiques  », 
par  le  Docteur  Jacques  Bertillon,  p.  313. 
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l'instant,  bornons-nous  à  ce  qui  a  trait  à  la  fixation  de  la 
relation  conventionnelle  entre  la  grandeur  moyenne  des  or- 
donnée» et  l'unité  de  mesure  des  abcisses.  L'Institut  inter- 
national de  statistique,  sur  la  proposition  de  M.  March,  a 
admi&  notamment  de  substituer  aux  nombres  à  représenter 
le  rapport  de  toutes  les  ordonnées  à  leur  valeur  moyenne  ; 
afin  d'éviter  de  recommencer  les  calculs  de  moyennes 
chaque  fois  qu'une  année  nouvelle  vient  s'ajouter  aux  autres, 
on  est  convenu  de  déterminer  une  moyenne  de  base  portant 
toujours  sur  les  mêmes  années,  par  exemple  1901-1910.  On 
recommande,  dans  ce  cas,  de  représenter  la  grandeur  de 
base  par  une  longueur  égale  à  celle  qui  représente  trente 
années.  Cette  convention  admise,  dit  M.  March,  la  courbe 
étendue  à  partir  de  0,  sur  cent  années,  aurait  une  pente  de 
3/10  ;  limitée  à  10  années  seulement,  elle  aurait  la  pente  de 
3/1;  pour  30  années,  la  courbe  se  trouverait  inclinée  à  45" 
et  l'utilisation  de  la  feuille  de  papier  se  trouverait  la  plus 
complète  possible. 

Dans  un  travail  antérieur  (1)  nous  avons  appliqué  cette 
méthode  à  l'illustration  des  données  de  la  statistique  com- 
merciale, sauf  que  le  point  100  sur  l'axe  des  ordonnées  re- 
présente cinquante  années  et  non  trente  ;  ce  dernier  nombre 
convient  mieux  pour  les  phénomènes  démographiques  que 
pour  les  faits  économiques.  La  moyenne  annuelle  des  im- 
portations et  exportations  réunies  de  la  Belgique  de  1901  à 
1910,  a  été  de  5,637,950,833  francs.  Cette  moyenne  est  sup- 
posée égale  à  100;  une  même  longueur  prise  sur  l'axe  des 
ordonnées  et  sur  l'axe  des  abcisses  représente  le  point  100 
et  cinquante  années;  la  longueur  prise  sur  l'axe  des  ordon- 
nées est  partagée  en  100  parties  égales  qui  correspondent 
aux  variations  pour  cent  ;  tous  les  chiffres  absolus,  de  1831 
à  1910,  sont  transformés  ensuite  en  nombres  proportion- 
nels. Nous  les  donnons  ci-après  pour  chaque  année  termi- 
nant une  période  décennale. 


(1)  «  Le  Commerce  extérieur  de  la  Belgique.  »  («  Etudes  sur  la  Belgique  », 
Anvers,  1912.) 
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ANNÉES 

VALEUR  ABSOLUE 

PIIOPORTION  % 

1NS1 

KA^  RA\ 

O   'J  ,l 
O.u  1 

1840 

ÏAX  fîAq 

fi  1 9 

1850 

A'A\  ÙKK  770 

7  fifi 

1  ■  DO 

1860 

l/OU  ,  *7  T  *  ,t/  1  1 

1  i  . >)  l 

1870  

1,610,901,700 

28.57 

1880  

2,897,633,273 

51.39 

3.109,139,044 

55.14 

1900  

4,138,637,146 

75.40 

1910  

1 

7,672,389,012 

436.09 

L'allure  du  diagramme  est  aussi  juste  que  possible,  alors 
qu'il  est  si  facile,  avec  la  progression  rapide  des  chiffres 
du  commerce,  de  donner  à  la  courbe  une  pente  exagérée. 


Fig.  39. 
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366.  La  matière  présente  assez  d'importance  au  point  de 
vue  technique  pour  qu'il  soit  opportun  de  donner  un  second 
exemple  accompagné  d'un  exposé  détaillé  et  critique.  Nous 
reprenons  donc  l'exemple  que  nous  avons  utilisé  précédem- 
ment, relatif  aux  variations  du  bénéfice  moyen  à  la  tonne 
réalisé  par  les  charbonnages  belges  de  1885  à  1915. 

Nous  commençons  par  calculer  la  moyenne  annuelle  des 
nombres  compris  dans  la  période  1901-10.  Le  calcul  donne 
pour  résultat  1.32;  la  valeur  fr.  1.32  représentera  donc  le 
point  100  sur  l'axe  des  ordonnées.  La  distance  entre  le 
point  100  et  l'origine  du  système  sera  égale  à  la  longueur 
portée  sur  l'axe  des  abcisses  pour  représenter  la  période 
des  31  années  observées,  si  l'on  adopte  entièrement  la  con- 
vention proposée  par  l'Institut  international  de  statistique. 
Si  l'on  préfère  admettre  que  le  point  100  représente  50  an- 
nées, la  longueur  portée  sur  les  abcisses  sera  de  31/50  de 
celle  portée  sur  les  ordonnées.  Tous  les  chiffres  sont  rap- 
portés à  la  valeur  de  base  fr.  1.32.  Voici  les  résultats  de  ce 
calcul  : 


ANNÉES 

°/o 

ANNÉES 

% 

ANNÉES 

1885 

30.3 

1895 

30.3 

1905 

63.3 

1886 

22  7 

1896 

39.3 

1906 

144.7 

1887 

36.4 

1897 

68.6 

1907 

164.0 

1888 

49.2 

1898 

79.5 

1908 

103.7 

1889 

84.0 

1899 

121.9 

1909 

56.1 

1890 

215  1 

1900 

322.7 

1910 

37.8 

1891 

137.8 

1901 

176.5 

1911 

10.6 

1892 

45.4 

1902 

106.8 

1912 

25.7 

1893 

25.0 

1903 

93.1 

1913 

63.3 

1894 

30.3 

1904 

56.8 

1914 

47.7 

1915 

56.8 
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Le  lecteur,  en  utilisant  une  feuille  de  papier  quadrille' 
pourra  très  rapidement  tracer  le  diagramme.  Il  ne  pourra 
manquer  de  faire  la  remarque  que  la  forme  du  graphique 
est  plus  élancée  que  dans  le  diagramme  construit  d'après 
les  nombres  absolus,  le  maximum  (1900  =  322.7)  étant  trois 
fois  2/10  plus  élevé  que  la  moyenne  et  que  la  distance  cou- 
verte sur  l'axe  des  abeisses  par  la  série  des  années. 

367.  Cette  remarque  nous  amène  à  dire  quelques  mots  de 
l'influence  de  la  position  de  la  moyenne  sur  l'allure  de  la 
courbe. 

Dans  le  cas  actuel,  si  la  moyenne,  au  lieu  d'être  établie 
sur  les  années  1901-10,  l'avait  été  sur  les  années  1900-09, 
donc  avec  une  avance  d'une  année  seulement,  elle  eût  at- 
teint le  chiffre  de  fr.  1.70  au  lieu  de  fr.  1.32  et  le  pourcen- 
tage le  plus  élevé  eût  été  de  250  seulement  au  lieu  de  322. 
L'allure  de  la  courbe  aurait  été  très  différente  de  celle 
qu'elle  présente  quand  la  courbe  est  établie  d'après  les  chif- 
fres proportionnels  reproduits  ci-dessus.  La  convention  de 
prendre  uniformément  la  moyenne  sur  les  années  1901-10 
présente  l'avantage  de  ne  pas  récessiter  de  nouveaux  cal- 
culs à  chaque  année  qui  s 'ajout 3  à  la  série,  mais  elle  a  aussi 
l'inconvénient  de  ne  pas  tenir  compte  dans  tous  les  cas  du 
véritable  emplacement  de  la  moyenne  et  de  dénaturer  alors 
l'allure  de  la  courbe.  Le  lecteur  en  sera  convaincu  en  jetant 
les  yeux  sur  les  calculs  suivants  qui  se  rapportent  au  som- 
met observé  en  1900  et  en  déterminant  la  hauteur  d'après 
différents  systèmes  de  prendre  la  moyenne  : 

Moyenne  1001-1910  =  fr.  1.32  =  100;  1900  =  fr.  4.26  =  322.7 
Moyenne  1900-1909  =  fr.  1.70  =  100;  1900  =  fr.  4.26  =  250.6 
Moyenne  1885  1915  =  fr.  1.87  =  100;  1900  =  fr.  4.26  =  227  8 

La  convention  admise  par  l'Institut  international  de  sta- 
tistique s'adapte  bien  aux  phénomènes  qui  ne  sont  pas  sus- 
ceptibles de  modifications  importantes  ou  rapides,  comme 
les  phénomènes  démographiques.  Il  n'en  va  plus  de  même 
quand  les  variations  sont  profondes  et  précipitées,  comme 
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c'est  souvent  le  cas  dans  les  faits  économiques;  le  gra- 
phique prendrait  une  allure  plus  exacte  s'il  était  établi  en 
adoptant  pour  base  la  moyenne  de  la  série  entière.  Il  est 
vrai  qu'à  chaque  année  on  se  trouve  obligé  dans  ce  cas,  de 
recommencer  le  calcul  de  moyenne,  mais  ce  n'est  là  qu'un 
inconvénient  négligeable  en  regard  de  l'avantage  d'une 
courbe  dont  l'allure  est  absolument  exacte. 

2°  Diagrammes  de  distribution  ou  histogrammes. 

368.  Les  diagrammes  de  distribution  sont  ceux  qui  ont 
pour  but  de  faciliter  l'étude  d'nne  série  de  faits  considérés 
à  un  moment,  indépendamment  de  l'ordre  dans  lequel  ils 
ont  pu  se  produire.  Ainsi,  la  division  du  temps,  qui  est  un 
élément  essentiel  dans  les  diagrammes  de  succession  ou  his- 
torigrammes  est  exclue  des  graphiques  dont  il  s'agit  ici. 
Cette  différence  entre  les  diagrammes  dont  il  a  été  question 
est  essentielle  mais  il  en  est  d'autres  encore  qu'on  peut  ran- 
ger sous  trois  chefs  : 

1°  Quand  il  trace  un  historigramme,  le  statisticien  ne  doit 
porter  sur  l'axe  des  abcisses  qu'un  nombre  de  divisions  re- 
lativement peu  élevé,  il  est  rare  qu'il  dispose  de  séries  com- 
prenant plus  de  cinquante  divisions  du  temps.  Au  con- 
traire, les  diagrammes  de  distribution  s'appliquent  à  des 
séries  comportant  souvent  un  grand  nombre  de  degrés  de 
variabilité  à  inscrire  sur  l 'axe  des  abcisses,  tandis  que  cette 
nécessité  ne  se  fait  pas  sentir  au  même  point  pour  le  dia- 
gramme de  succession;  dans  ce  dernier,  une  division  de 
l'axe  des  abcisses  est  réservée  à  chaque  division  du  temps, 
le  plus  souvent  l 'année  ;  au  contraire  dans  le  diagramme  de 
distribution,  comme  on  ne  peut  songer  à  porter  sur  l'axe 
des  abcisses  des  divisions  en  nombre  tel  qu'elles  fassent  ap- 
paraître séparément  chaque  degré  de  variabilité  du  phéno- 
mène, il  faut  alors  établir  des  classes  parmi  les  variables. 
Nous  avons  exposé  plus  haut  les  règles  théoriques  de  la  di- 
vision par  classes. 
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2"  Les  diagrammes  de  succession  ont  une  forme  irrégu- 
lière, tandis  qu'on  a  constaté  parmi  les  courbes  de  disper- 
sion une  régularité  assez  grande  pour  que  le  professeur 
Pearson  ait  pu  en  calculer  six  types  différents.  (Cfr.  n*  20G.) 

La  courbe  de  distribution  symétrique  parfaite,  dont  nous 
parlerons  au  chapitre  suivant,  est  la  formule  typique  du 
polygone  de  fréquence  exprimé  au  moyen  du  diagramme  de 
distribution  ou  histogramme.  Elle  a  pour  formule  : 

n 

Au  moyen  de  cette  formule  on  peut  calculer  la  valeur  de 
chaque  ordonnée  y  à  toute  distance  x  mesurée  le  long  de 
l'axe  X  X'  à  partir  du  mode.  La  lettre  e  représente  la  base 
du  système  népérien  de  logarithmes  :  2.71828  ;  a  —  la  dévia- 
tion type,  n  —  le  nombre  total  de  variables;  tt  =  2.14159... 

3°  Les  diagrammes-  de  succession  représentent  simple- 
ment l'importance  d'un  fait  unique,  en  rapportant  cette 
donnée  à  l'époque  à  laquelle  il  s'est  produit.  Les  dia- 
grammes de  distribution  envisagent  deux  faits  en  fonction 
l'un  de  l'autre  :  des  ouvriers  et  le  salaire  qu'ils  gagnent, 
par  exemple. 

369.  Les  diagrammes  de  distribution  peuvent  être  éta- 
blis de  deux  façons  : 

A.  Sur  l'axe  des  abcisses  on  porte,  à  intervalles  égaux, 
les  divisions  des  différentes  classes  dont  se  compose  la  sé- 
rie. Sur  l'axe  des  ordonnées  on  indique  les  divisions  par 
fréquence;  pour  chaque  classe,  on  note  la  hauteur  corres- 
pondante à  la  fréquence  de  la  classe  et  on  réunit  les  points 
par  une  série  de  droites.  Le  point  est  placé  au  milieu  de 
l'intervalle  de  la  classe.  Le  diagramme  établi  d'après  ces 
bases  porte  le  nom  de  polygone  de  fréquence. 

B.  On  peut  aussi  élever  sur  chaque  intervalle  des  classes 
un  rectangle  ayant  cet  intervalle  comme  base  et  dont  la  hau- 
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teur  est  égale  à  la  fréquence  de  la  classe.  Ce  diagramme  a 
reçu  le  nom  d'histogramme  (K.  Pearson). 

Nous  avons  donné  plus  haut,  en  étudiant  la  théorie  de  la 
distribution,  de  nombreux  modèles  de  polygones  de  fré- 
quence et  d'histogrammes  :  nous  prions  le  lecteur  de  s'y 
reporter. 

370.  Presque  toujours,  les  termes  extrêmes  de  la  série 
continue  sont  en  nombre  très  limité,  ainsi  qu'il  résulte  des 
caractères  généraux  de  la  courbe  des  erreurs.  La  question 
se  pose  de  savoir  si  l'on  peut  considérer  ces  termes  ex- 
trêmes comme  des  accidents  et  ne  pas  les  comprendre  dans 
le  calcul.  On  ne  doit  pas  se  résoudre  à  cette  dernière  solu- 
tion sans  de  bonnes  raisons.  Pour  le  cas  où  l'on  devrait  pro- 
céder à  cette  élimination,  voici  quelle  est  la  marche  du  cal- 
cul : 

Reprenons  l'exemple  du  ((  Pimpinella  saxifraga  L  » 
que  nous  avons  donné  au  n°  219.  Nous  avons  les  données 
suivantes  : 

Nombre  de  rayons  :  5,  6,  7,  8,  9,  10,  11,  12,  13,  14,  15. 
Nombre  d'exemplaires  :  1,  5,  9,  22,  38,  62,  61,  29,  14,  4,  4. 

M  =  10.253         cr  =  1.786 

2n         1  497 

K  =  —,  -  =        =  0,49899 

in  99b 

D'après  la  table  des  valeurs  de  «  probabilité  intégrale 
normale  »  insérée  dans  les  «  statistical  methods  »  de 
C.  B.  Davenport  (table  IV)  nous  voyons  qu'au  nom- 
bre 0.49899  correspond  la  valeur  3.08.  La  limite  de 
déviation  peut  alors  être  considérée  comme  égale 
à  3.08  X  1-786  (a)  =  5.50088.  La  classe-limite  =  10.253  — 
5.501  =  4.752. 

Aucune  observation  ne  tombant  dans  une  classe  infé- 
rieure à  la  classe-limite,  il  n'y  a  lieu  d'exclure  du  calcul  au- 
cune des  données  de  l'expérience. 

371.  Les  conventions  admises  en  ce  qui  concerne  les 
courbes  chronologiques  peuvent  s'appliquer  avec  quelques 
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modifications  aux  courbes  de  fréquence.  De  même  qu'on 
l'a  vu  plus  haut,  l'Institut  international  de  statis- 
tique a  recommandé,  pour  les  courbes  de  fréquence,  de 
rapporter  chaque  ordonnée  à  l'ordonnée  moyenne,  ou  à  la 
somme  des  ordonnées,  c'est-à-dire  à  la  surface  de  la  courbe. 
En  vue  d'utiliser  le  mieux  possible  la  surface  d'une  feuille 
de  papier,  supposée  carrée,  M.  L.  Mardi  a  établi  que  le  ré- 
sultat le  meilleur  serait  atteint  si  l'on  donnait  à  une  ampli- 
tude E,  comprenant  la  moitié  de  la  surface,  une  longueur- 
égale,  sur  l'axe  des  abcisses,  au  dixième  de  celle  qui  mesu- 
rerait le  total  des  observations  et  que,  d'autre  part,  la 
colonne  médiane  représentant  la  moitié  des  observations 
aurait  comme  hauteur,  environ  cinq  fois  l'amplitude  E.  Ces 
suggestions  sont  utiles  pour  réaliser  l'unité  en  matière  de 
graphiques,  mais-  elles  sont  toujours  subordonnées  aux  in- 
dications résultant  de  la  nature  du  cas  particulier  à  ré- 
soudre. 

C.  —  Courbes  logarithmiques. 

372.  Il  semble,  après  l'exposé  des  systèmes  graphiques 
qui  vient  d'être  fait,  que  la  statistique  ait  à  sa  disposition 
un  instrument  à  la  fois  fidèle  et  précis  pour  traduire  d'une 
façon  schématique  les  mouvements  et  les  modifications  des 
phénomènes  démographiques,  économiques  et  sociaux.  Mais 
si  les  modes  habituels  de  représentation  graphique  peuvent 
suffire,  dans  le  plus  grand  nombre  de  cas,  à  ce  qu'on  attend 
d'eux,  il  est  cependant  des  circonstances  où  leur  apparente 
précision  pourrait  n'être  qu'une  illusion. 

Les  diagrammes  orthogonaux  historiques  basés  sur  les 
nombres  absolus  des  variables  peuvent  facilement  donner 
naissance  à  des  erreurs  d'appréciation.  Leur  échelle  des  or- 
données est  établie  d'après  des  divisions  conventionnelles, 
ou  ce  qui  vaut  mieux,  elle  est  basée  sur  une  moyenne.  Si  la 
valeur  unitaire,  portée  en  ordonnée,  est  élevée»  les  oscilla- 
tions de  faible  importance  absolue  seront  à  peine  percep- 
tibles bien  que  leur  importance  relative,  à  l'égard  des  don- 
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nées  les  plus  proches,  soit  tout  aussi  grande  que  celle  des 
ordonnées  se  rapportant  à  des  nombres  élevés.  Bowley 
donne  un  exemple  bien  choisi,  faisant  toucher  du  doigt  cette 
difficulté  :  le  commerce  d'exportation  de  l'Angleterre,  dit- 
il,  qui  était  de  52  millions  de  livres  en  1815,  tomba  à  42  mil- 
lions l'année  suivante  :  cette  diminution  de  20  p.  c.  est 
presque  imperceptible  dans  un  diagramme  historique 
s 'étendant  à  la  période  séculaire  du  xixe  siècle,  tandis  que 
l'attention  se  porte  immédiatement  sur  la  dépression  qui 
se  marque  entre  1883  où  le  commerce  d'exportation  attei- 
gnait une  valeur  de  305  millions  et  1886  où  il  ne  représen- 
tait plus  que  269  millions,  ce  qui  fait  12  p.  c.  de  diminution. 

La  raison  en  est  qu'avec  l'échelle  arithmétique  des  dia- 
grammes orthogonaux,  la  position  d'un  point  sur  les  ordon- 
nées varie  dans  la  même  mesure  aussi  bien  dans  le  cas 
d'une  augmentation  en  valeur  d'un  million  de  francs  suc- 
cédant à  «ne  valeur  de  10  millions,  que  dans  le  cas  d'une 
augmentation  d'un  million  après  avoir  enregistré  une  va- 
leur de  100  millions.  De  part  et  d'autre,  il  y  a  une  même 
valeur  absolue  qui  se  marque  par  un  égal  accroissement  me- 
suré sur  l'échelle  des  ordonnées,  mais  la  première  hausse 
d'un  million  représente  10  p.  c.  de  la  valeur  précédente  et  la 
seconde  n'atteint  que  1  p.  c.  Or,  l'importance  relative  des 
changements  survenus  au  cours  de  la  période  historique  ira- 
porte  plus,  en  général,  que  leur  grandeur  relative.  Veut-on. 
par  exemple,  mesurer  l'intensité  des  mouvements  représen- 
tés par  le  diagramme,  ce  sont  les  changements  relatifs  que 
l'on  consultera  bien  plus  que  les  nombres  absolus.  Pour  re- 
présenter graphiquement  les  modifications  relatives  d'un 
phénomène,  on  a  recours  aux  courbes  logarithmiques  dans 
lesquelles  on  substitue  aux  nombres  absolus,  sur  l'échelle 
des  ordonnées,  leurs  logarithmes. 

373.  La  construction  des  courbes  logarithmiques  pré- 
sente certaines  particularités  sur  lesquelles  il  est  utile  d'at- 
tirer l'attention.  Le  lecteur  trouvera  dans  n'importe  quel 
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traité  d'arithmétique  les  éléments  de  la  théorie  des  loga- 
rithmes, qu'il  n'est  donc  pas  expédient  de  rapporter  ici. 
Toutefois,  il  convient  de  faire  remarquer  ici  que  les  courbes 
logarithmiques  n'expriment  pas  les  variations  absolues  des 
nombres  dont  elles  dérivent,  mais  bien  leurs  variations  re- 
latives. Ce  sont,  dit  Bowley,  des  diagrammes  de  rapports, 
non  de  quantités  (1).  Ce  point  qui  ne  devra  pas  être  perdu  de 
vue,  précise  l'usage  qu'il  est  permis  de  faire  de  ces  courbes 
et  les  circonstances  dans  lesquelles  elles  peuvent  être  em- 
ployées. 

Prenons,  comme  premier  exemple,  les  données  déjà  uti- 
lisées au  n°  362  relatives  au  bénéfice  moyen  à  la  tonne  réa- 
lisé par  les  charbonnages  de  Belgique  de  1885  à  1915.  Nous 
inscrivons,  en  regard  des  nombres  absolus,  leurs  loga- 
rithmes. Le  lecteur  se  rappellera  que  les  nombres  infé- 
rieurs à  l'unité  ont  des  logarithmes  négatifs  qui  sont  d'au- 
tant plus  grands  relativement  que  ce»  nombres  sont  plus 
petits,  le  logarithme  de  zéro  étant  l'infini  négatif  : 


ANNÉES 

NOMBRES 
ABSOLUS 

LOGARITHMES 

ANNÉES 

NOMBRKS 
ABSOLUS 

LOGARITHMES 

18S5 

0.40 

T.60205999 

1901 

2,33 

0  36735592 

1886 

0,30 

7.47712125 

1902 

1.41 

0.1492191 1 

1887 

0.48 

1.68124124 

1903 

1.23 

0  0899i  51 1 

1888 

0,65 

T. 81291336 

1904 

0,75 

1.87506126 

1889 

1,11 

0.04532298 

1905 

0,83 

1.919078"9 

1890 

28,4 

0.45331834 

1906 

1  91 

0  28103337 

1891 

1.82 

0.26007139 

1907 

2,16 

(•.33445375 

1892 

0,60 

T. 77815125 

1908 

1.37 

0.13672057 

1893 

0  33 

1,51851394 

1909 

07,4 

1.86923172 

1894 

0  40 

T.60205999 

1910 

0.50 

1.69897000 

1895 

0  40 

T.60205999 

1911 

0.14 

T.  14612804 

1896 

0  52 

T.7160Ô334 

1912 

0.34 

1.53147892 

1897 

0,90 

1.95424251 

1913 

0.83 

T 91907809 

1898 

1,05 

0  021 18930 

1914 

0  63 

T.  79934055 

1899 

1.71 

0  23299611 

1915 

0,75 

T.87506126 

1900 

4,26 

0.62940960 

(1)  Bowley,  Eléments  of  statisties,  p.  189 
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Cherchant  une  division  propre  à  établir  l'échelle  des  or- 
données d'après  une  base  logarithmique,  nous  observons 
que  la  différence  entre  les  logarithmes  de  fr.  0.15  et  0.30 
est  :  Ï.17609126  —  1.47712] 25,. soit  .30103099  ou  en  abrégé, 
.301.  Pour  chaque  intervalle  logarithmique  de  .301  nous  por- 
tons donc  une  longueur  conventionnelle.  Les  ordonnées- 
sont  alors  déterminées  facilement  et  il  ne  reste  qu'à  pro- 
céder avec  les  logarithmes  comme  avec  les  nombres  natu- 
rels, l'axe  des  abscisses  étant,  comme  dans  les  diagrammes 
ordinaires,  réservé  aux  divisions  du  temps. 

Lp  principe  essentiel  de  la  courbe  logarithmique  est  que 
les  proportions  des  nombres  entre  eux  restant  égales,  peu 
importent  les  nombres  sur  lesquels  elles  sont  prises.  Ainsi  : 

log.  0.15  =  r.176;  16g.  0.30  =  T. 477    Différence  =  301 
mai» 

log  0.30  =  T.477;  log.  0.60  =  L778    Différence  =  .SOI 

parce  que  ces  logarithmes  sont  respectivement,  dans  les 
deux  cas,  dans  le  rapport  de  1  à  2. 

Du  principe  précédent,  il  résulte  que  les  nombres  natu- 
rels ne  peuvent  être  disposés  à  intervalles  égaux  comme 
dans  les  diagrammes  ordinaires,  car  la  courbe  logarithmique 
est  basée  sur  les  rapports  et  non  sur  les  quantités  absolues. 
Le  diagramme  basé  sur  ces  principes  reproduit,  en  courbe 
logarithmique,  les  données  absolues  exprimées  graphique- 
ment dans  le  diagramme  simple.  Bien  que  l'allure  générale 
de  la  courbe  ne  soit  pas  beaucoup  modifiée,  il  est  à  remar- 
quer qu'aucune  des  données  de  la  courbe  logarithmique  ne 
correspond  exactement  à  la  donnée  correspondante  du  dia- 
gramme simple.  En  général,  la  forme  est  plus  massive  et 
les  différences  entre  les  sommets  sont  moins  accentuées. 

374.  Mais  l'utilité  des  courbes  logarithmiques  apparaît 
surtout  quand  il  s 'agit  de  traduire  graphiquement  une  série 
ascendante  dans  laquelle  les  quantités  absolues  sont  très 
différentes  à  la  fin  de  ce  qu'elles  étaient  au  début.  Dans  une 
statistique  relative,  par  exemple,  aux  dépôts  existant  dans 
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les  caisses  d'épargne,  il  est  évident  que  le  montant  des  dé- 
pôts est  intéressant  en  lui-même  :  à  cet  égard,  un  histori- 
gramme  ordinaire  peut  jouer  un  rôle  utile.  Mais  cette 
figure  ne  peut  nous  apprendre  qu'une  chose,  à  savoir  de 
combien  de  millions  le  montant  total  des  dépôts  a  augmenté 
d'année  en  année.  Mais  pour  l'économiste  comme  pour  le 
sociologiste,  il  est  une  autre  question  beaucoup  plus  inté- 
ressante qui  est  celle-ci  :  quelles  sont  les  époques  aux- 
quelles la  classe  des  déposants  a  fait  preuve  de  la  plus 
grande  capacité  d'épargne?  Cette  question  comporte  une 
étude  des  nombres  relatifs,  et  graphiquement  elle  ne  trouve 
sa  solution  que  dans  la  courbe  logarithmique.  Les  données 
qui  suivent  constituent  une  application  de  la  méthode  aux 
données  statistiques  concernant  les  dépôts  à  la  caisse  géné- 
rale d'épargne  et  de  retraite  en  Belgique,  de  1865  à  1900. 


Montant  des  dépôts  sur  livrets  par  100  habitants  à  la  Caisse 
Générale  d'Épargne  et  de  Retraite  de  Belgique  (matériel  extrait  de 
l'exposé  de  la  situation  du  Royaume  de  1876  à  1900,  t.  II,  p.  696.) 


Années, 

Dépôts 
sur  livrels 
par 

100  habitants. 

Logarithmes 
(*)• 

Années. 

Dépôts 
sur  livrets 
par 

100  habitants. 

Logarithmes 
(1). 

1865 

11 

1.041 

1883 

2,302 

3  362 

1866 

25 

1  398 

1884 

2,869 

3.410 

18H7 

85 

1.929 

1885 

3,047 

3.484 

1868 

147 

2.167 

1886 

3  475 

3  541 

1869 

226 

2  354 

1887 

3,831 

3  583 

1870 

2( '5 

2.312 

18*8 

4,146 

3.618 

1871 

253 

2  403 

1889 

4,483 

3  652 

1872 

3ô0 

2  544 

1890 

5.198 

3.716 

1873 

424 

2  627 

1891 

5,273 

3.722 

1874 

496 

2.695 

1892 

5,452 

3.736 

1875 

662 

2  820 

1893 

6  036 

3  781 

1876 

1,056 

3  024 

1*94 

6.526 

3  815 

1877 

1,255 

3.099 

1895 

6,861 

3  836 

1*78 

1.480 

3  170 

1896 

7,227 

3  859 

1879 

1,715 

3.234 

1897 

7.848 

3  895 

1880 

1,987 

3  298 

1898 

8,298 

3  919 

1881 

2,044 

3.310 

1899 

8,846 

3.949 

1882 

2,081 

3.318 

1900 

9,669 

3.985 

(1)  Il  suffit  de  prendre  les  logarithmes  avec  3  décimales, 
une  simplification  notable. 


ce  qui  réalise 
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Nous  avons  construit  sur  le  même  diagramme  la  courbe 
du  diagramme  orthogonal  ordinaire  et  la  courbe  logarith- 
mique. 


Fig.  40. 


L'échelle  des  abcisses,  portant  les  divisions  du  temps,  est 
commune  aux  deux  courbes.  L'échelle  des  ordonnées  pour 
le  diagramme  orthogonal  simple  est  tracée  de  façon  à  ce 
que  ses  divisions  soient  en  nombre  égal  à  celles  de  l'échelle 
de  la  courbe  logarithmique;  chaque  division  est  égale  à 
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4(i0  francs  de  sorte  que  toute  augmentation  de  1  /10  sur 
l'échelle  des  ordonnées  représente  40  fr.  Pour  l'échelle  loga- 
rithmique, on  a  admis  que  toute  division  égale  correspond 
à  150  fr.  Les  logarithmes  étant  ainsi  localisés,  on  obtient 
une  courbe  très  caractéristique,  essentiellement  différente 
de  la  courbe  ordinaire.  La  réunion  des  deux  courbes  sur  le 
même  diagramme  permet  de  lire  immédiatement  la  valeur 
en  francs  équivalente  à  toute  donnée  logarithmique  partant 
d'un  point  quelconque  de  cette  courbe,  il  suffit  de  chercher 
le  point  situé  sur  la  même  ordonnée,  appartenant  à  la  courbe 
ordinaire  et  de  lire  en  regard  la  valeur  inscrite  sur  l'échelle 
de  droite.  Ainsi,  en  1882,  le  point  sur  l'ordonnée  logarith- 
mique correspond  à  1,840  francs  plus  5  fois  46  francs  = 
2,070  ;  la  valeur  réelle  est  2,081,  mais  le  diagramme  ne  per- 
met pas  une  lecture  d'une  précision  égale  à  celle  d'une  table 
numérique.  Le  procédé  employé  pour  la  construction  de  ce 
diagramme  dispense  du  calcul  d'une  échelle  de  nombres  ab- 
solus correspondant  aux  variations  logarithmiques  et  pré- 
sente encore  l'avantage  d'une  comparaison  immédiate  entre 
les  deux  courbes.  Le  lecteur  remarquera  que  sur  la  courbe 
logarithmique,  l'inclinaison  est  beaucoup  moins  forte  les 
dernières  années  qu'au  début  de  la  période  observée. 
Les  deux  courbes  sont  intéressantes  mais  leur  signification 
est  différente  :  la  courbe  à  ordonnées  ordinaires  traduit 
l'accumulation  des  sommes  placées  en  dépôt  en  tenant 
compte  du  nombre  d'habitants  :  la  courbe  à  ordonnées  loga- 
rithmiques marque  l'effort  réalisé  par  les  épargnants  pro- 
portionnellement aux  efforts  antérieurs;  à  mesure  que  les 
chiffres  haussent,  cette  proportion  a  une  tendance  à  dimi- 
nuer parce  qu'il  est  plus  difficile  d'atteindre  un  quantum 
d'augmentation  sur  de  grands  nombres  que  sur  de  petits. 
Au  total,  la  courbe  logarithmique  marque  un  effort  d'une 
remarquable  continuité,  mais  très  différent  de  celui  qu'on 
pourrait  déduire  de  la  courbe  ordinaire. 


38 
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375.  Les  courbes  logarithmiques  comprennent  une  autre 
variété  de  courbes  caractéristique  auxquelles  on  a  donné 
le  nom  de  courbes  à  double  échelle  logarithmique.  Elles  sont 
aux  premières  ce  que  les  diagrammes  de  distribution  (po- 
lygones de  fréquence)  sont  aux  diagrammes  de  suc- 
cession (historigrammes).  Au  lieu  de  porter  sur  l'axe 
des  abscisses  les  divisions  du  temps,  nous  y  portons 
une  seconde  échelle  logarithmique  basée  sur  les  carac- 
tères de  divisibilité  du  groupe  :  par  exemple,  les  taux  de 
salaires  des  ouvriers  dont  les  nombres  sont  portés  en  or- 
données, ou  encore,  le  taux  du  revenu  des  contribuables  im- 
posés d'après  cette  base.  Dans  les  diagrammes  à  double 
échelle  logarithmique,  la  courbe  hyperbolique  des  dia- 
grammes de  distribution  se  change  en  une  droite,  comme 
il  est  facile  de  le  démontrer. 

D.  —  Diagrammes  polaires. 

376.  Les  diagrammes  polaires  sont  basés  sur  une  démons- 
tration géométrique  différente  de  celle  qui  s'applique  aux 
diagrammes  orthogonaux;  il  y  a  lieu  de  s'y  arrêter  un 
instant. 

Sur  un  axe  horizontal  placé  arbitrairement  dans  un  plan, 
fixons  un  point  fixe  0  considéré  comme  l'origine  du  sys- 
tème. Pour  déterminer  le  point  M  situé  dans  le  plan,  il  suf- 
fit de  connaître  la  distance  0  M,  quantité  arithmétique  que 
l 'on  désigne  par  la  lettre  p  et  l 'angle  positif  w  <  2  tt  compris 
entre  p  et  l'axe  horizontal.  On  appelle  p  le  rayon  vecteur  du 
point  M  et  «  l'angle  polaire  du  même  point;  l'axe  horizon- 
tal porte  le  nom  d'axe  polaire  et  le  point  fixe  0  est  le  pôle. 
La  quantité  p  peut  varier  de  zéro  à  l'infini  positif  et 
l'angle  w  de  0  à  2  tt  .  p  et  co  sont  les  coordonnées  polaires 
de  M. 

On  peut  admettre  des  rayons  vecteurs  négatifs  au-des- 
sous de  l'axe  horizontal;  on  les  porte  sur  la  direction  oppo- 
sée à  la  direction  M  correspondant  à  l'angle  '<■>.  Dans  ce 
cas,  les  coordonnées  du  point  M2  seront  p  et  2  tt  —  œ. 
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Toute  relation  entre  p  et  w  représente  en  général  une 
ligne,  et  réciproquement. 

Dans  les  diagrammes  polaires,  les  ordonnées  sont  por- 
tées autour  d'un  point  central  pour  venir  aboutir  à  l'axe 
des  abcisses  auquel  on  a  donné  la  forme  circulaire  au  lieu 
de  le  tracer  dans  le  sens  horizontal.  Les  ordonnées  ont  une 
longueur  proportionnelle  au  fait  qu'elles  représentent;  le 
fait  est  situé  à  une  longueur  M  du  centre,  l'ordonnée  est  le 
rayon  vecteur  p.  Les  ordonnées  sont  en  nombre  variable  ; 
cependant,  un  trop  grand  nombre  de  données  à  représenter 
rendraient  le  diagramme  polaire  d'un  usage  difficile.  On  ré- 
serve généralement  cette  forme  graphique  aux  phéno- 
mènes auxquels  est  liée  l'idée  de  direction  (direction  des 
vents,  etc.)  ou  aux  faits  qui  se  distribuent  dans  le  temps 
selon  un  cycle  invariable.  L'axe  des  abcisses  est  mesuré  par 
un  rayon  sur  lequel  sont  portées  les  divisions  quantitatives 
auxquelles  on  fait  décrire  un  cercle.  Les  extrémités  des  or- 
données sont  reliées  entre  elles  par  des  droites.  Les  sail- 
lants montrent  les  quantités  en  excédent  sur  la  valeur  arbi- 
traire, choisie  pour  abcisse,  les  rentrants  marquent  les 
quantités  déficitaires. 

L'exemple  suivant  peut  servir  d'illustration. 


Nombre  annuel  de  mariages  par  mois  en  Belgique,  de  1896  à  1900 

(Moyenne  annuelle) 


MOIS 

NOMBRE  DE 
MARIAGES 

MOIS 

nombre  de 
mariages 

Janvier. 

4,  174 

Juillet  .... 

4,090 

Février. 

4,966 

Août 

4,081 

Mars  .... 

2,388 

Septembre . 

5,146 

Avril  .... 

6,045 

Octobre 

5,152 

Mai  

5,722 

Novembre  . 

4,842 

Juin  

4,365 

Décembre  . 

4,170 

Total  :  55,141. 

Moyenne  :  4,595. 

596 


PRINCIPES  DE  STATISTIQUE 


Pour  construire  ce  diagramme,  nous-  faisons  la  moyenne 
4,595  égale  à  1,000  et  nous  calculons  les  valeurs  proportion- 
nelles des  données  de  chaque  mois  mais  sur  cette  base. 
Représentant  la  moyenne  par  un  rayon  d'une  longueur  con- 
ventionnelle, nous  traçons  une  circonférence  représentant 
les  valeurs  de  l'ordonnée  moyenne;  le  cercle  est  divisé  en 
12  parties  correspondant  aux  mois  de  l'année;  la  valeur 
relative  de  l'ordonnée  est  portée  au  centre  de  l'intervalle 
et  tous  les  points  sont  ensuite  reliés  par  des  droites. 

E.  —  Cartogramm.es. 

377.  Ainsi  que  leur  nom  l 'indique,  les  cartogrammes  loca- 
lisent sur  une  carte  géographique  les  faits  statistiques 
qu'ils  expriment.  Telle  est  la  signification  première  du 
mot  :  cartogramme.  Mais,  par  extension,  le  même  nom  a  été 
donné  à  des  représentations  graphiques  qui,  sans  l'aide  des 
données  géographiques,  marquent  l'intensité  relative  d'un 
fait  au  moyen  de  couleurs  ou  de  parties  ombrées,  sans  re- 
courir aux  mesures  de  surface  ou  de  longueur  qui  sont  le 
propre  des  diagrammes.  Nous  examinerons  successivement 
ces  diverses  méthodes. 

378.  Parmi  les  cartogrammes  proprement  dits,  nous  dis- 
tinguons :  1°  les  cartes  avec  diagrammes;  2°  les  cartes  tein- 
tées ;  3°  les  cartes  à  bandes  ;  4°  les  cartes  avec  courbes. 

1°  Cartes  avec  diagrammes.  —  On  peut  inscrire  des  dia- 
grammes sur  des  cartes  muettes  de  façon  à  localiser  le  fait 
qu'on  veut  représenter.  L'élément  essentiel  est  ici  le  dia- 
gramme, l'accessoire  la  carte  géographique.  Cela  ne  veut 
pas  dire  que  l'élément  géographique  soit  dépourvu  de  signi- 
fication. On  pourrait,  il  est  vrai,  se  contenter  d'écrire  au- 
dessous  de  chaque  diagramme  le  nom  de  la  partie  du  terri- 
toire qu'il  concerne,  mais  le  fait  de  placer  chaque  graphique 
à  l'endroit  même  de  la  carte  où  se  passe  le  fait  observé 
rend  l'ensemble  des  constatations  beaucoup  plus  clair  et 
plus  suggestif.  Qu'il  s'agisse  de  la  culture  du  froment  ou  de 
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la  vigne,  de  la  proportion  des  naissances  ou  des  décès  par 
1,000  habitants,  du  nombre  de  crimes,  ou  du  mouvement  des 
ports,  l'utilisation  d'une  carte  est  un  procédé  d'une  grande 
utilité  :  d'abord,  parce  qu'il  groupe  les  éléments  à  étudier 
et  attire  forcément  l'attention  sur  leur  concentration  ou 
leur  dispersion;  ensuite  parce  qu'il  suggère  l'étude  des  re- 
lations du  phénomène  avec  le  milieu.  On  réussit  par  ce 
moyen  à  donner  une  idée  claire  de  phénomènes  très  com- 
plexes. M.  Cheysson,  par  exemple,  a  représenté  l'accrois- 
sement ou  la  diminution  de  la  population  dans  chaque  dé- 
partement français  à  chacun  des  quatorze  recensements  qui 
avaient  été  exécutés  à  l'époque  où  son  travail  a  paru  :  il 
l'a  fait  au  moyen  de  cercles  divisés  en  quatorze  secteurs  et 
placés  chacun  sur  le  territoire  du  département.  Quand  on 
a  à  comparer  les  résultats  d'un  dénombrement  à  deux 
époques,  on  peut  recourir  à  l'emploi  de  rectangles  d'une 
grandeur  proportionnelle  au  fait,  divisés  en  deux  parties 
dont  l'une,  colorée,  marque  l'intensité  du  phénomène  au 
moment  de  la  dernière  observation  et  dont  l'autre,  ombrée, 
signifie  l'intensité  à  l'époque  antérieure. 

.'379.  Les  graphiques  combinés  avec  les  cartogrammes 
sont  un  moyen  précieux  de  réaliser  la  représentation  de 
phénomènes  complexes.  En  1896,  le  recensement  général  de 
l'industrie  et  des  métiers  qui  fut  fait  à  cette  date  en  Bel- 
gique, nous  a  donné  l'occasion  de  présenter  sous  une  forme 
graphique,  simple  et  rapide,  le  phénomène  complexe  de  l'at- 
traction exercée  par  les  centres  industriels  sur  les  localités 
environnantes;  il  s'agissait  de  montrer,  par  un  carto- 
gramme  intuitif  :  1°  les  communes  dont  se  composait  le 
centre  industriel  étudié  ;  2°  les  communes  où  habitaient  les 
ouvriers  allant  travailler  dans  ce  centre  industriel;  3°  le 
nombre  de  ces  ouvriers  (approximativement)  ;  4°  le  groupe 
industriel  duquel  dépendait  leur  profession.  Après  avoir 
défini  le  sens  donné  à  l'expression  «  centre  industriel  » 
nous  avons  tracé  sur  une  carte  géographique  le  contour  des 
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communes  composant  ce  centre  ;  tout  autour  sont  disposées 
les  communes  dont  une  certaine  population  industrielle  va 
travailler  dans  ce  centre.  Pour  le  nombre  des  ouvriers  et 
le  groupe  auquel  ils  appartiennent,  on  a  commencé  par 
attribuer  un  numéro  d'ordre  à  chaque  groupe  de  profession 
(au  total  8)  ;  la  présence  d'ouvriers  appartenant  à  un  cer- 
tain groupe  industriel  est  signalée  pour  chaque  commune, 
par  l'inscription  sur  le  territoire  de  cette  commune  d'un 
petit  carré  ([_])  à  l'intérieur  duquel  se  trouve  un  chiffre 
correspondant  au  numéro  d'ordre  du  groupe.  Les  chiffres 
droits  [£]  représentent  une  dizaine,  les  chiffres  inclinés  [T] 
une  fraction  de  dizaine  d'ouvriers  appartenant  à  l'indus- 
trie à  laquelle  ce  chiffre  est  attribué.  Ainsi  |  t  \  i  |  1  r~T~] 
signifie  :  entre  30  et  40  ouvriers  appartenant  à  l'industrie 
des  mines,  habitant  la  commune  où  ces  chiffres  sont  inscrits 
et  allant  travailler  dans  l'agglomération  urbaine  ou  indus- 
trielle à  laquelle  la  carte  se  rapporte  (1). 

380.  Cartes  teintées.  —  Dans  les  travaux  statistiques, 
beaucoup  de  données  sont  publiées  d'après  une  base  géo- 
graphique ou  politique  :  la  région  agricole  ou  industrielle, 
la  province,  département  ou  comté,  le  district,  le  canton,  etc. 
Il  était  dès  lors  tout  indiqué  d'employer  des  cartes  pour 
localiser  l'expression  du  phénomène,  mais  au  lieu  de  re- 
courir, pour  ce  faire,  à  des  diagrammes,  on  a  eu  l'idée  d'em- 
ployer les  couleurs  pour  signifier  l'importance  relative  des1 
résultats.  Bien  que  le  procédé  soit  très  simple  et  presque 
dépourvu  de  difficultés,  il  n'en  est  pas  moins  vrai  que  des 
bévues  se  commettent  encore  :  ainsi  le  manque  de  relation 
entre  l'unité  géographique  choisie  et  le  fait  spécial  à  re- 
présenter. Dans  un  recensement  agricole,  on  a,  par  exemple, 
adopté  pour  unité  géographique  de  représentation  gra- 
phique... le  canton  judiciaire!  C'est  la  même  chose  que  sij 


(1)  Koyaume  de  Belgique.  Atlas  statistique  du  recensement  général  des 
industries  H  des  métiers  (31  octobre  1806),  Bruxelles,  1903,  p.  5.  (Cfr. 
Planches  XVI  à  XXIII). 
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pour  la  statistique  judiciaire,  on  prenait  pour  base  géogra- 
phique le  ressort  des  agronomes  de  l'Etat.  A  défaut  de 
division  naturelle  adéquate,  il  faut  se  borner  à  employer  les 
divisions  politiques  usuelles.  De  ces  dernières,  la  meilleure 
est  la  commune  parce  qu'elle  est  la  plus  homogène.  Dans  les 
grands  pays,  la  présentation  graphique  ou  statistique,  par 
commune,  est  parfois  irréalisable,  mais,  dans  les  petits 
pays,  elle  est  fort  à  recommander. 

L'établissement  d'une  carte  teintée  repose  sur  ce  prin- 
cipe :  étant  donnée  une  collectivité,  un  phénomène  complexe 
dont  les  manifestations  sont  plus  ou  moins  intenses,  le  sta- 
tisticien opère  des  groupements,  d'après  lesquels  il  arrête 
une  échelle  de  teintes  :  à  la  teinte  la  plus  claire  correspond 
la  densité  la  plus  faible  et  ainsi  de  suite.  L'échelle  des 
faits  peut  être  établie  en  tenant  compte  des  nombres 
absolus  ou  des  nombres  proportionnels  ou  relatifs. 
On  peut  aussi  rapporter  les  chiffres  absolus  à  une 
unité  convenue.  Ainsi,  l'échelle  des  faits  peut  être  déter- 
minée dans  un  recensement  de  la  population,  d'après  le 
nombre  d 'habitants,  par  kilomètre  carré  ;  dans  le  recense- 
ment allemand  du  14  juin  1895,  nous  voyons,  par  exemple, 
que  la  densité  de  la  population  est  exprimée  au  moyen  de 
sept  catégories  (de  15.68  hab.  à  2,036  hab.  par  kilomètre 
carré)  auxquelles  correspondent  autant  de  teintes  distinctes 
obtenues  clans  une  seule  couleur  au  moyen  de  «  grisés  »  (1). 
Mais,  en  général,  l'emploi  des  nombres  relatifs  doit  être 
préféré  :  ce  procédé  est  plus  exactement  représentatif  que 
l'autre,  en  ce  qu'il  élimine  les  éléments  variables  qui  peu- 
vent modifier  la  répartition  géographique  du  fait  envisagé, 
et  parce  qu'il  facilite  ainsi  les  comparaisons. 

La  distribution  des  entreprises  de  l'industrie  alimen- 
taire, en  nombre  absolu,  donne  une  grande  importance  à 
tous  les  centres  urbains;  la  base  est  meilleure  si  l'on  consi- 


(1)  Die  bernfliche  und  sozialc  gliederung  des  Deutschen  Volkes  nach 
(1er  berufzahlvng  von  lé-Juni  1895,  Berlin,  1809,  p.  11. 
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(1ère  le  nombre  de  ces  entreprises  pour  10,000  habitants, 
l'influence  des  grands  centres  se  trouvant  ainsi  annihi- 
lée (1). 

381.  Des  discussions  se  sont  engagées  à  propos  du  nom- 
bre de  couleurs  à  employer  :  certains  spécialistes  ne  veulent 
entendre  parler  que  de  teintes  monochromes,  d'autres  sont 
résolument  polychromistes.  Ces  derniers  font  observer 
qu'il  est  difficile  d'arriver  à  exprimer  suffisamment  de 
rapports  de  variabilité  à  l'aide  d'une  couleur  unique,  dont 
les  teintes,  au  delà  d'un  nombre  d'ordinaire  limité,  ne 
peuvent  que  difficilement  se  différencier.  On  peut  répon- 
dre que  l'échelle  de  variabilité  peut  être  assez  restreinte 
sans  nuire,  en  général,  à  l'exactitude  de  la  présentation 
statistique  et  que,  somme  toute,  par  l'emploi  de  «  grisés  », 
on  arrive  à  multiplier  le  nombre  de  teintes  qu'on  peut  tirer 
d'une  couleur  unique  :  pour  notre  part,  nous  en  avons  ob- 
tenu huit  ou  neuf,  très  aisément  perceptibles,  ce  qui  est  lar- 
gement suffisant  dans  le  plus  grand  nombre  de  cas  (2). 

M.  Levasseur,  souvent,  emploie  deux  couleurs  :  le  rouge 
et  le  bleu;  le  rouge  pour  toutes  les  divisions  territoriales 
où  le  fait  s'élève  au-dessus  de  la  moyenne  de  l'ensemble 
du  pays,  le  bleu  pour  celles  où  le  fait  est  inférieur  à  la 
moyenne.  Ce  système  a  donné  à  l'auteur  de  bons  résultats. 
Au  surplus,  la  controverse  est  dénuée  de  portée  scientifique 
si  l'on  admet,  de  part  et  d'autre,  que  la  qualité  maîtresse 
d'une  représentation  graphique  consiste  dans  sa  clarté. 

Les  couleurs  peuvent  être  remplacées  par  des  hachures 
imprimées  en  noir.  Ce  système  est  beaucoup  moins  coûteux 
que  l'impression  en  couleurs,  mais  le  résultat  est  moins  at- 
trayant et  ne  présente  pas  autant  de  clarté. 

La  publication  des  cartogrammes  est  devenue  plus  abor- 


(!)  Maech  (L.)j  «  Les  représentations  graphiques  et  la  statistique  com- 
parative ».  (Journal  de  la  Société  de  Statistique  de  Paris,  1905.) 

(2)  Voyez  Atlas  statistique  du  recensement  général  des  industries  et  des 
métiers,  Bruxelles,  1903. 
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dabJe,  depuis  qu'on  a  eu  l'idée  de  schématiser  les  cartes 
géographiques  en  divisant  la  surface  du  pays  en  un  grand 
nombre  de  parties  se  coupant  à  angles  droits,  correspon- 
dant aux  divisions  géographiques,  s 'emboîtant  les  unes 
dans  les  autres  comme  un  jeu  de  puzzle;  on  a  appliqué  le 
même  système  aux  divisions  politiques  pour  figurer  le  nom- 
bre d'élus  de  chaque  parti  dans  les  divers  arrondissements 
électoraux.  La  carte  en  couleurs  de  la  composition  du 
Reichstag  allemand  après  les  élections  de  1903,  reproduite  à 
la  suite  du  rapport  de  M.  Mayet  (1)  est  extrêmement  inté- 
ressante; en  lithographie,  on  évite  de  la  sorte  un  laborieux 
travail  de  dessin  et  le  repérage  est  plus  facile;  en  impres- 
sion ordinaire,  l'imprimeur  prépare  à  l'avance,  pour  chaque 
division  administrative,  la  gamme  complète  des  clairs  et 
des  ombres,  de  façon  qu'il  dispose  à  l'avance  d'un  matériel 
adéquat  à  tous  les  degrés  de  variabilité  du  phénomène.  Les 
maisons  d'impression  se  chargent  même  d'opérer  la  divi- 
sion schématique  du  territoire  d'après  les  indications  du 
bureau  de  statistique. 

382.  Cartes  à  bandes.  —  Une  application  ingénieuse  de  la 
méthode  graphique  à  la  statistique  des  transports  a  été 
l'invention  des  cartes  à  bandes.  Des  bandes  coloriées,  tra- 
cées sur  une  carte  géographique,  suivent  la  direction  des 
voies  de  communication;  elles  sont  d'une  largeur  propor- 
tionnelle à  l'importance  du  fait  qu'elle  représentent.  Une 
même  bande  peut  se  composer  de  plusieurs  bandes  paral- 
lèles, comme  un  total  peut  se  composer  de  plusieurs  élé- 
ments. Ces  diagrammes  ont  l'avantage  de  réunir  les  rensei- 
gnements portant  sur  les  quantités  et  rendent  de  grands 
services  dans  la  statistique  des  transports  :  chemins  de  fer, 
canaux,  routes,  ports  en  rivière  et  ports  de  mer.  Leur  calcul 
ne  présente  aucune  espèce  de  difficulté  :  on  adopte  au  début 


(1)  Mayet,  «  Die  schematiscli-statistichen  Karten  des  Kaiserlichen  sta- 
tistielien  Amtes  zn  Berlin  ».  (Bulletin  de  l'Institut  International  de  Statis- 
tique, t.  XTV,  3e  livre,  p.  214.) 
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la  convention  qu'un  certain  nombre  de  tonnes  de  marchan- 
dises ou  un  nombre  de  voyageurs  sera  représenté  par  une 
bande  d'une  largeur  déterminée.  On  peut  distinguer  les 
transports  d'après  le  genre  de  .moyen  de  locomotion  en  se 
servant  de  couleurs  ou  de  hachures.  Le  lecteur  trouvera 
de  nombreuses  applications  de  ces  diagrammes  dans  les 
«  albums  de  statistique  graphique  »  publiés  autrefois  par 
M.  Cheysson. 

383.  Cartes  avec  niveau.  —  Dans  les  cartes  géogra- 
phiques, les  topographes  emploient,  pour  figurer  le  relief 
et  les  dépressions  du  terrain,  les  courbes  de  niveau  :  ce 
sont  des  plans  horizontaux,  équidistants  et  parallèles-,  qui 
passant  par  un  grand  nombre  de  points  dont  l'altitude  est 
connue,  figurent  l 'aspect  du  sol  avec  ses  collines,  ses  val- 
lées et  ses  plaines.  Lorsque  les  courbes  de  niveau  sont  nom- 
breuses et  serrées  les  unes  contre  les  autres,  c'est  une  col- 
line; lorsqu'elles  sont  largement  espacées,  c'est  une  plaine 
que  nous  avons-  sous  les  yeux.  La  même  convention  peut 
être  adoptée  à  l'égard  des  faits  statistiques  :  au  lieu  de 
collines,  admettons  qu'il  s'agisse  de  populations  forte- 
ment agglomérées  (plusieurs  centaines  par  kilomètre 
carré)  ;  nous  supposerons  que  les-  faits  sont  superposés  les 
uns  aux  autres  et  par  tous  les  points  d'une  égale  impor- 
tance, entre  les  limites  de  chaque  classe,  nous  ferons  pas- 
ser une  courbe  de  niveau.  On  obtient  de  la  sorte  une  carte 
statistique  avec  niveau,  à  la  condition  que  pour  chaque 
point  du  territoire  (la  commune),  on  dispose  des  renseigne- 
ments de  fait  nécessaires.  Le  procédé  est  laborieux,  d'une 
exécution  lente  et  d'une  lecture  assez  malaisée;  nous  lui  pré- 
férons, sans  aucun  doute,  les  simples  cartes  teintées.  Une 
remarque  analogue  s 'applique  aux  cartes  en  relief  ;  M.  Le- 
vasseur  en  a  fait  une  critique  qui  nous  semble  justifiée  (1). 


(1)  Levasse!:!:,  «  La  s  Statistique  graphique  ».  {Jubilec  volume  of  the 
JStat.  Soc,  p.  245.) 
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384.  Autres  figures  coloriées  (non  accompagnées  de 
cartes).  —  Bien  que  les  cartogrammes  soient,  par  essence, 
des  représentations  statistiques  au  moyen  de  cartes,  on 
range  dans  la  même  catégorie,  les  figures  coloriées  au 
moyen  desquelles  se  marquent  les  rapports  de  densité.  On 
en  a  fait  quelques  applications  heureuses  que  nous  signa- 
lons brièvement. 

Un  maître  regretté  de  la  statistique  française,  M.  de  Fo- 
ville,  s'est  efforcé  de  marquer  les  variations  d'un  certain 
nombre  d'éléments  intéressant  la  prospérité  publique,  au 
moyen  de  teintes  et  de  couleurs  (1).  Le  système  graphique 
de  M.  de  Foville  consiste,  comme  l'auteur  l'explique  lui- 
même,  en  une  sorte  de  table  de  Pythagore,  plus  haute  que 
large,  comprenant  dans  le  sens  de  la  hauteur  autant  de 
bandes  horizontales  que  d'indices  consultés  et,  dans  le  sens 
de  la  largeur,  un  nombre  de  bandes  verticales  aussi  fré- 
quentes que  les  années  sur  lesquelles  s'étend  la  recherche. 
Selon  que  les  résultats  sont  qualifiés  de  bons,  assez  bons, 
médiocres  ou  mauvais,  les  carrés  formés  par  l'intersec- 
tion des  bandes  verticales  et  horizontales  sont  coloriés  en 
rouge,  rose,  gris  ou  noir.  Il  en  résulte  une  impression  d'en- 
semble de  nature  intuitive.  Ce  système  n'échappe  pas  à 
quelques  critiques;  nous  en  parlerons  au  tome  second  de 
cet  ouvrage,  où  nous  examinerons  avec  détail  les  procédés 
de  la  «  Sémiologie  économique  ». 

M.  Benini  a  donné  dans  ses  «  Principii  di  statistica  »  un 
exemple  intéressant  de  cartogramme  non  géographique, 
ainsi  qu'il  dénomme  cette  figure  (2).  Le  problème  posé  est 
le  suivant  :  pour  onze  groupes  d'âges  divisant  la  popula- 
tion italienne  en  1886,  exprimer  graphiquement  la  mortalité 
relative  par  mois  et  par  groupe  d'âge.  L'auteur  a  com- 
mencé par  établir  sept  gradations  de  mortalité,  le  nombre 


(1)  de  Foville,  «  Essai  de  Météorologie  économique  et  sociale  ».  (Journal 
de  la  Société  de  Statistique  de  Paris,  1888,  p.  243.) 

(2)  Benini,  loc.  cit.,  pp.  154-155. 
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sept  ne  pouvant  guère  être  dépassé  si  l'on  veut  obtenir  des 
teintes  faciles  à  distinguer  les  unes  des  autres;  le  chiffre 
relatif  le  plus  bas  renseigné  dans  la  table  originaire  est  71  ; 
le  plus  élevé  est  151  ;  la  différence  80  divisée  par  7  donne 
pour  quotient  11.43;  chaque  classe  se  forme  par  l'addition 
de  11.43  au  chiffre  le  plus  bas,  puis  au  chiffre  suivant  im- 
médiatement le  chiffre  le  plus  élevé  du  groupe  précédent  et 
ainsi  de  suite. 

Onze  bandes  verticales  représentent  les  onze  catégories 
d'âges;  chacune  est  divisée  en  12  parties  égales  correspon- 
dant à  un  mois  de  l'année.  Le  résultat  est  très  frappant  en 
ce  sens  qu'il  marque  immédiatement  l'existence  d'un  maxi- 
mum de  mortalité,  pour  les  classes  d'âges  les  moins  éle- 
vées, pendant  les  mois  chauds  (juillet,  août,  septembre)  ; 
cette  mortalité  diminue  progressivement  à  mesure  qu'on 
s'élève  dans  l'échelle  des  âges,  sauf  que  le  mois  d'août  reste 
longtemps  celui  où  la  mortalité  est  la  plus  forte  ;  pour  les 
vieillards,  le  maximum  de  la  mortalité  s'observe  au  con- 
traire en  hiver.  (Décembre  à  mars.) 

F.  —  Stéréogrammes. 

385.  Toutes  les  figures  que  nous  avons  passées  en  revue, 
étant  situées  dans  un  plan,  deux  éléments  seulement  étaient 
à  déterminer;  les  diagrammes  solides  ou  stéréogrammes 
sont  des  figures  situées  dans  l'espace  et,  par  conséquent,  un 
troisième  élément  s'ajoute  aux  deux  autres  :  cette  circon- 
stance, tout  en  compliquant  le  graphique,  le  rend  apte  à 
figurer  les  phénomènes  statistiques  qu'il  serait  impossible 
de  représenter  dans  un  plan.  Les  diagrammes  ordinaires  ne 
permettent  que  la  représentation  de  deux  faits,  comme  le 
nombre  de  décès  et  le  temps,  le  nombre  des  ouvriers  ga- 
gnant un  salaire  et  le  taux  de  ce  salaire,  la  taille  des  con- 
scrits et  leur  nombre  par  grandeur.  Le  plus  souvent,  le 
but  de  la  statistique  est  atteint  quand  elle  dispose  de  deux 
éléments,  parfois  elle  en  réclame  davantage;  c'est  alors 
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qu'apparaît  l'utilité  du  stéréogramme  qui  vient  combler 
une  réelle  lacune;  ainsi,  par  exemple,  on  peut  mettre  en 
relation  le  nombre  de  naissances  avec  l'âge  du  père  et  de 
la  mère  au  moment  du  mariage,  etc.  Le  statisticien  italien 
-Perozzo,  qui  avait  été  chargé  par  la  direction  générale  de 
la  statistique  du  royaume  d'Italie  de  dresser  des-  modèles 
de  stéréogrammes,  en  a  fait  plusieurs  qui  sont  restés  clas- 
siques et  dont  on  trouvera  la  reproduction  et  la  description 
dans  un  grand  nombre  de  traités,  ce  qui  nous  dispense  d'en 
reproduire  le  dessin  avec  les  commentaires.  Nous  notons 
seulement  les  éléments  qui  se  peuvent  distinguer  sur  le  sté- 
réogramme construit  par  le  savant  géomètre,  relatif  à  la 
population  de  la  Suède  de  1750  à  1875  ;  leur  nombre  est  la 
démonstration  la  plus  évidente  de  la  supériorité  du  stéréo- 
gramme  sur  le  diagramme  comme  quantité  de  faits  emma- 
gasinés. Ce  sont  :  1°  le  mouvement  général  des  naissances  ; 
2°  les  variations  du  chiffre  de  la  population  à  chaque  recen- 
sement ;  3°  le  nombre  des  recensés  à  chaque  âge  ;  4°  le  nom- 
bre de  survivants  à  chaque  génération;  5°  les  individus  en 
force  numérique  égale.  Les  crises  économiques  et  sociales 
peuvent  aussi  être  suivies  sur  le  "stéréogramme,  comme  on 
peut  y  voir,  vingt-cinq  ou  trente  ans  plus  tard,  les  consé- 
quences de  la  diminution  des  naissances. 

S'il  est  exact  de  dire  qu'aucune  autre  forme  de  dia- 
gramme n'est  capable  de  réunir  un  aussi  grand  nombre  de 
données,  il  ne  faut  point  manquer  d'ajouter  que  la  repré- 
sentation simultanée  d'éléments  aussi  nombreux  conduit  à 
la  complication  et  à  la  confusion.  Un  diagramme  perd  la 
plus  grande  partie  de  son  utilité  si  la  clarté  lui  fait  défaut, 

Malgré  ce  que  peut  avoir  d'un  peu  effrayant,  à  première 
vue,  l'emploi  des  trois  dimensions,  la  construction  du  sté- 
réogramme ne  donne  pas  lieu  à  de  très  grosses  difficul- 
tés. Nous  essayerons  d'en  déterminer  les  principes  d'après 
un  exemple  simple  et  en  éliminant  de  notre  exposé  tout  ce 
qui  pourrait  rebuter  le  lecteur. 
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Nous  avons  vu  précédemment  ce  qu'on  entend  par 
«  table  de  corrélation  ».  C'est  un  tableau  à  double  en- 
trée dans  lequel  les  fréquences  sont  indiquées  par  paires 
d'éléments.  Un  exemple  de  table  de  corrélation  est  celle  qui 
est  formée  des  données  relatives  à  l'âge  du  mari  et  à  l'âge 
de  la  femme  au  moment  de  la  célébration  du  mariage,  à 
une  certaine  année.  Nous  avons  précisément  donné  un 
exemple  semblable  emprunté  à  la  statistique  de  la  Belgique. 
(Cfr.  n°  318.)  Un  autre  exemple  de  table  de  corrélation  est 
celui  du  nombre  d'enfants  d'une  femme,  et  le  nombre  d'en- 
fants qu'a  eus  la  fille  de  cette  femme.  Dans  le  sens  horizon- 
tal sont  inscrites  les  données  relatives  au  nombre  d'enfants 
des  mères  et  dans  le  sens  vertical,  le  nombre  d'enfants  des 
filles  (1). 

Nous  pouvons,  à  l'aide  d'une  table  de  corrélation,  décrire 
aisément  la  construction  d'un  stéréogramme.  Nous  suppo- 
sons qu'on  trace  sur  une  surface  plane  une  série  de  traits 
correspondant  à  l'emplacement  de  chaque  colonne  :  traits 
verticaux  pour  les  âges  du  mari  portés  en  abcisses,  traits 
horizontaux  pour  les  âges  de  la  femme,  portés  en  ordon- 
nées. On  obtiendra  ainsi  une  sorte  de  surface  réticu- 
laire;  à  l'intersection  des  lignes,  on  pourra  lire  certains 
chiffres  indiquant  le  nombre  de  mariages  accomplis  entre 
des  hommes  de  tel  âge  avec  des  femmes  de  tel  âge.  Qu'on 
élève  ensuite,  à  ce  point  de  la  surface,  une  ligne  verticale 
dont  la  hauteur  correspondra  au  nombre  des  unités  indi- 
qué au  point  de  rencontre  et  qu'on  réunisse  tous  les  som- 
mets des  verticales  :  on  obtiendra  de  la  sorte  un  stéréo- 
gramme  qu'on  appelle  une  surface  de  fréquence,  qui  cor- 
respond aux  courbes  ordinaires  dont  il  a  été  parlé  au 
chapitre  de  la  distribution.  Si  la  distribution  des 
fréquences  est  idéale,  c'est-à-dire  que  pour  tous  les  âges 
elle  commence  par  des  nombres  peu  élevés,  pour  atteindre 


(1)  Mémoire  de  K.  Pearson,  Alice  Lee  et  L.  Bramley  Moore.  Phil. 
Trans.,  vol.  CXCII,  1899,  tableau  IV. 
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son  maximum  vers  la  moyenne  et  diminuer  ensuite  graduel- 
lement, la  surface  de  fréquence  aura  une  forme  régulière, 
de  même  que  la  courbe  idéale  de  fréquence  des  diagrammes 
ordinaires.  Dans  une  surface  de  fréquence  absolument  régu- 
lière, une  des  sections  quelconques  du  solide  reproduirait 
la  figure  de  la  courbe  binomiale  régulière.  Nous  avons  vu 
que  les  courbes  peuvent  se  subdiviser,  comme  Pearson  l'a 
montré,  en  un  certain  nombre  de  types  auxquels 
toutes  les  courbes  quelconques  peuvent  être  ramejiées. 
Mais  il  n'en  est  pas  de  même  pour  les  surfaces  de  fréquence 
parce  que  leurs  variétés  sont  trop  nombreuses  ;  la  symétrie 
parfaite  dans  les  surfaces  de  fréquence  est  encore  plus  rare 
que  dans  les  courbes  de  fréquence. 

Le  lecteur  remarquera  que  cette  construction  n'est 
qu'une  extension  de  la  méthode  cartésienne  des  coordon- 
nées. Au  lieu  de  mesurer  au  moyen  de  deux  axes  orthogo- 
naux, x  et  y,  les  valeurs  de  deux  variables,  on  emploie  ici 
trois  axes,  x,  y  et  .s  orthogonaux  entre  eux,  à  l'effet  de  me- 
surer trois  variables,  deux  axes  x  et  y  restent  dans  un  plan 
horizontal,  tandis  que  le  troisième  est  dressé  dans  la  posi- 
tion verticale;  les  constructions  de  l'espèce  dépendent  de  la 
géométrie  analytique  dans  l'espace. 

386.  Les  stéréogrammes  présentent  un  intérêt  scienti- 
fique et  théorique  qui  n'a  pas  son  pendant,  sous  le  rapport 
pratique.  Ces  figures  sont  à  la  fois  trop  coûteuses  et  trop 
enèombrantes,  pour  l'enseignement,  si  elles  sont  faites  en 
relief.  Si  on  les  remplace  par  une  figure  géométrique,  elles 
ne  sont  utiles  qu'à  ceux  qui  possèdent  des  connaissances 
plus  ou  moins  étendues  en  géométrie,  et  précisément,  parmi 
les  personnes  s 'appliquant  à  l'étude  des  questions  écono- 
miques et  sociales,  ces  connaissances  ne  sont  pas  des  plus 
répandues.  C'est  ici  le  lieu  de  rappeler  ces  paroles  de 
M.  Levasseur  :  «  Il  ne  faut  pas  oublier  que  les  graphiques 
statistiques  sont  surtout  un  moyen  de  vulgariser  les  nom- 
bres, et  que,  dès  qu'ils  demandent  à  l'esprit  plus  d'efforts 
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qu'il  n'en  faut  pour  étudier  et  comparer  ces  nombres,  ils 
n'ont  plus  de  raison  d'être  (1)  ». 

III.  —  La  statistique  graphique  comparative. 

387.  La  fonction  des  graphiques  n'est  pas  seulement  dé- 
monstrative; elle  est,  tout  autant,  comparative.  L'idée  de 
représenter  une  foule  de  chiffres  par  une  simple  courbe 
épousant  les  variations  de  la  série  et  en  traçant  le  schéma 
d'une  façon  rapide  et  sûre,  fait  naître  nécessairement  cette 
autre  idée  d'employer  le  même  procédé  à  la  comparaison. 
S'il  n'y  avait  que  peu  de  nombres  à  rapprocher  les  uns 
des  autres,  on  n  'éprouverait  pas  le  besoin  de  recourir  aux 
graphiques;  mais  on  se  trouve  d'ordinaire  devant  des  di- 
zaines, parfois  des  centaines  de  chiffres  à  comparer...  Pour 
suppléer  à  l 'insuffisance  de  notre  mémoire,  nous  avons  heu- 
reusement les  graphiques,  dont  nous  pouvons,  sous  cer- 
taines conditions,  rapprocher  les  renseignements.  On  peut 
ainsi  définir  le  rôle  des  représentations  graphiques  sous  le 
rapport  comparatif  :  1°  elles  mettent  en  lumière  les  relations 
réciproques  des  phénomènes  ;  2°  elles  peuvent  aider  à  dé- 
couvrir ce  qu'il  y  a  de  permanent  dans  ces  relations  ;  3°  elles 
servent  à  l'étude  des  phases  d'un  même  phénomène  et  en 
décèlent  les  irrégularités  et  les  anomalies  ;  4°  elles  peuvent 
aider  à  rectifier  les  données  fautives  et  à  compléter  les  sé- 
ries où  se  remarque  quelque  lacune  (2). 

388.  Suffit-il,  pour  obtenir  une  vue  rapide  et  précise  des 
points  à  comparer,  de  rapprocher  deux  diagrammes  quel- 
conques? On  sent  très  bien  que  non.  Si  la  relation  entre 
l'unité  de  mesure  des  abcisses  et  l'unité  de  mesure  des  or- 
données n'est  pas  la  même  dans  les  diagrammes  qu'on  dé- 


fi) Levasseue,  «  La  statistique  graphique  ».  (Jubilee  volume  of  the 
Statist.  Soc.,  London,  1885,  p.  247). 

(2)  March  (L.),  «  Les  représentations  graphiques  et  la  statistique  compa- 
rative ».  (Bulletin  de  la  Société  de  Statistique  de  Paris,  1904,  p.  408). 
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sire  comparer,  il  n'y  a  pas  lieu  de  les  rapprocher.  Les  gra- 
phiques peuvent  servir,  en  des  mains  malhonnêtes,  à  créer 
des  fantasmagories  auxquelles  se  laissent  prendre  trop 
souvent  les  non-initiés  et  les  naïfs.  Avant  donc  de  comparer 
un  tracé  graphique  à  un  autre,  il  faut  s'assurer  qu'ils  sont 
bien  l'un  et  l'autre  à  la  même  échelle  et  s'il  n'en  est  pas 
ainsi  il  faut  employer  une  formule  de  réduction  très  simple, 
recommandée  par  l'Institut  international  de  statistique  (1)  : 
si  l'échelle  des  diagrammes  n'est  pas  la  même,  il  suffit, 
pour  les  unifier,  de  substituer  aux  nombres  à  représenter 
le  rapport  de  toutes  les  ordonnées  à  leur  valeur  moyenne 
calculée  sur  une  période  fixe,  par  exemple  1901-1910  et  dont 
la  grandeur  de  base,  égale  à  100,  représentera  sur  l'axe  des 
ordonnées  une  distance  égale  à  celle  qui,  sur  l'axe  des  abs- 
cisses, mesure  trente  années. 

A  l'aide  de  la  réduction  arithmétique  qui  vient  d'être 
indiquée,  on  peut  très  facilement  et  avec  certitude  comparer 
entre  elles  des  courbes  chronologiques. 

389.  On  vient  de  voir  que  pour  comparer  entre  elles  des 
courbes  construites  à  des  échelles  différentes,  on  est  forcé 
de  les  ramener  à  des  chiffres  proportionnels.  L'avantage 
de  la  méthode,  qui  est  la  possibilité  de  comparer  entre  eux 
des  éléments  qui,  auparavant,  n'étaient  pas  comparables, 
est  évident;  il  ne  va  pas  cependant  sans  un  léger  inconvé- 
nient :  le  lecteur  se  trouve  dépourvu  des  données  en  nom- 
bres absolus  qui  donnent  leur  valeur  aux  chiffres  propor- 
tionnels. Pour  remédier  à  cette  lacune,  il  suffit  de  placer 
en  regard  de  l'échelle  des  chiffres  proportionnels  une  se- 
conde échelle  consacrée  aux  chiffres  absolus  :  prenant  un 
point  quelconque  de  l'échelle  proportionnelle,  on  calcule  sa 
valeur  en  nombres  absolus  et  on  divise  la  hauteur  totale  de 


(1)  Cfr.  Bull.  Instit.  Intcrn.  8tat.,  t.  XTX,  première  livraison,  p.  118 
et  suivantes.  Voyez  également  March  (L.),  loc.  cit.,  pp.  415-41C. 
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l'échelle  en  divisions  égales  correspondant  au  chiffre  de 
base. 

L'ensemble  des  règles  indiquées  ci-dessus  est  de  stricte 
interprétation;  à  défaut  de  s'y  conformer  il  n'est  pas  per- 
mis de  comparer  entre  eux  des  diagrammes  chronologiques 
ou  de  succession. 

390.  La  comparaison  des  courbes  de  distribution  doit 
être  envisagée  séparément,  à  raison  de  particularités  qui 
lui  sont  propres. 

Pour  obtenir  une  comparaison  rationnelle  entre  deux 
courbes  de  distribution,  il  faut  non  pas  comparer  entre  eux 
les  nombres  absolus,  mais  il  convient  de  figurer  au  moyen 
du  tracé  graphique,  les  nombres  proportionnels.  On  se  rend 
très  bien  compte  du  jugement  instinctif,  mais  faux,  qui  se- 
rait porté  par  le  lecteur  d'un  graphique  basé  sur  les  nom- 
bres absolus  :  supposons  comme  M.  March  l'a  fait,  deux 
catégories  d'ouvriers  A  et  B  ayant  exactement  la  même 
distribution  de  salaires,  mais  dont  l'une  (B)  est  deux  fois 
plus  nombreuse  que  l'autre  (A)  ;  traçons  les  deux  courbes, 
en  élevant  les  ordonnées  à  une  hauteur  proportionnelle  au 
nombre  d'ouvriers  par  classes  de  salaires,  il  en  résulte  que 
la  courbe  b  aura  des  ordonnées  d'une  longueur  double  à 
celle  de  toute  ordonnée  quelconque  de  a  et  que  la  propor- 
tion entre  sa  hauteur  et  sa  base  sera  toute  différente  de  celle 
qui  existe  pour  a.  On  devrait  donc  conclure  que  la  distribu- 
tion des  salaires  en  B  n'est  pas  la  même  que  la  répartition 
qui  se  remarque  en  A,  ce  qui  est  faux  par  hypothèse.  La 
comparaison  au  moyen  de  nombres  proportionnels  est  donc 
une  nécessité  en  ce  qui  concerne  les  courbes  de  distribution. 

La  distribution  comparée  des  salaires  parmi  les  ouvriers 
tisserands  (à  la  mécanique)  de  jute,  de  lin,  de  coton  et  de 
laine  s'établit  d'après  les  règles  précédentes  en  se  basant 
sur  les  données  numériques  ci-après  : 
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Distribution  des  salaires  parmi  les  tisserands  mâles 
de  plus  de  16  ans,  en  octobre  1901 

(Matériel  extrait,  de  :  Salaires  et  durée  du  travail  dans  les  industries  textiles 
au  mois  d'octobre  1901 ,  Bruxelles,  1905,  p.  154  et  155,  analyse). 
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Les  diagrammes  comparatifs  dressés  d'après  cette  mé- 
thode sont  très  clairs  et  tiennent  compte  de  toutes  les  exi- 
gences théoriques  de  la  comparaison  :  on  voit  parfaitement 
sur  le  diagramme,  combien  la  distribution  des  salaires  va- 
rie d'après  le  textile  mis  en  œuvre,  encore  que  la  spécialité 
professionnelle  (tisserands),  le  sexe,  l'âge  et  l'outillage 
(tissage  mécanique)  soient  les  mêmes  dans  tous  les  cas;  on 
ne  pourrait  souhaiter  de  démonstration  plus  évidente  et  ré- 
pondant plus  exactement  aux  exigences  de  la  comparaison. 

On  pourrait  cependant  regretter  que  la  substitution  des 
nombres  proportionnels  aux  chiffres  absolus  ait  pour  effet 
de  mettre  toutes  les  données  sur  le  même  plan,  malgré  que 
leur  importance  respective  soit  fort  différente  :  la  courbe 
de  533  tisserands  de  jute  a  autant  d'importance  que  celle 
relative  aux  2,871  tisserands  de  laine.  Il  est  facile  de  remé- 
dier à  cet  inconvénient,  quand  il  y  a  deux  courbes  à  compa- 
rer, en  reproduisant  l'échelle  des  nombres  absolus  du  côté 
opposé  à  celui  occupé  par  l'échelle  des  nombres  relatifs, 
mais  quand  il  y  a  un  certain  nombre  de  courbes  portées  sur 
la  même  feuille,  il  faut  nécessairement  isoler  les  courbes 
dont  on  veut  retracer  les  variations  absolues  et  relatives. 

Un  procédé  élégant  est  ainsi  indiqué  par  M.  L.  March  (1)  : 
le  rapport  entre  les  nombres  absolus  étant  connu,  par 
exemple,  2.25.  il  suffit,  pour  donner  aux  courbes  propor- 
tionnelles une  hauteur  répondant  aux  nombres  absolus,  de 
prendre  pour  unité  des  abcisses  une  longueur  égale  à 
l'unité  d'abcisse  du  diagramme  comparatif  multipliée  par 
la  racine  carrée  du  rapport  2.25,  et  de  procéder  de  même 
pour  l'unité  des  ordonnées.  «  Avec  ces  unités,  l'impression 
des  changements  absolus  et  relatifs  est  exacte,  et,  au  moyen 
d'une  double  échelle,  on  peut  aussi  bien  mesurer  les  uns  que 
les  autres.  » 


(1)  Mabch  (L.),  loo.  cit.,  p.  419 
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391.  La  statistique  comparative  trouve  son  application 
usuelle  dans  les  diagrammes,  mais  ce  serait  une  erreur  de 
penser  qu'elle  doive  rester  étrangère  à  la  matière  des  car- 
togrammes. M.  Cheysson  a  exposé,  en  1887,  les  moyens  de 
rendre  comparables  entre  elles  les  diverses  cartes  d'une 
série  de  cartogrammes,  et  son  système  peut  être  indiqué  et 
suivi  aujourd'hui  encore  (1). 

M.  Cheysson  a  fait  remarquer  qu'il  existe  un  grave  incon- 
vénient à  traiter  chaque  cartogramme  au  mieux  de  ses  né- 
cessités graphiques  et  de  ses  particularités  individuelles, 
sans  se  préoccuper  de  l'ensemble,  lorsque  la  série  des  car- 
togrammes se  rapporte  à  des  faits  homogènes  et  de  même 
famille.  Cet  inconvénient  consiste  en  ce  que  des  carto- 
grammes qui  traduisent  aux  yeux  la  même  opération  sous 
ses  divers  aspects  ne  peuvent,  sans  égarer  le  lecteur,  don- 
ner la  même  importance  graphique  à  des  faits  de  très  iné- 
gale densité.  La  classe  professionnelle  des  médecins,  par- 
tagée en  huit  teintes,  réparties  entre  les  provinces  ou  les 
arrondissements  d'un  Etat,  apparaîtra  aussi  dense  que  la 
catégorie  des  agriculteurs,  également  divisée  en  huit  teintes  ; 
cependant,  la  teinte  la  plus  foncée  correspondra  en  fait  à 
un  bien  plus  grand  nombre  d'agriculteurs  que  de  méde- 
cins... Pour  éviter  ce  trompe-l'œil,  comment  faut -il  procé- 
der? La  substitution  de  nombres  proportionnels  aux  nom- 
bres absolus  ne  peut  ici  obvier  en  rien  à  l'inconvénient 
signalé  qui  consiste  dans  l'attribution  d'une  même  teinte 
occupant  le  même  rang  dans  l'échelle  des  teintes  dégradées, 
à  deux  faits  de  densité  différente,  que  cette  densité  soit 
exprimée  par  des  chiffres  absolus  ou  par  des  chiffres  pro- 
portionnels. M.  Cheysson  a  proposé  de  remplacer  les  coef- 
ficients absolus  par  leurs  écarts  par  rapport  à  la  moyenne 
générale. 


(1)  Cheysson  (E.,),  «  Les  cartogrammes  à  teintes  graduées»,  (Journal 
de  la  Société  de  Statistique  de  Paris,  1887,  p.  128). 
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La  formule  de  l'écart  proportionnel  sera  e  =  d  ~  m  dans 
laquelle  d  est  l'écart  de  chaque  coefficient  et  m  la  moyenne 
générale. 

Comme  l'a  fait  remarquer  l'auteur  à  qui  est  due  la  mé- 
thode, la  substitution  des  écarts  aux  chiffres  absolus  con- 
serve l'importance  respective  des  faits,  leur  hiérarchie,  et 
permet  de  retrouver  sans  peine  le  fait  lui-même  sans 
l'écart.  Une  même  teinte  appliquée  à  des  faits  homogènes 
ne  signifiera  donc  pas  qu  'ils  ont  une  densité  comprise  dans 
les  mêmes  limites,  mais  simplement  que  l'écart  qu'ils  pré- 
sentent respectivement  à  la  moyenne  est  le  même. 

Il  est  évident,  comme  le  dit  encore  M.  Cheysson,  que 
l 'étude  d 'un  atlas  dont  toutes  les  cartes  seraient  basées  sur 
ce  principe,  est  plus  instructive  que  celle  de  documents  gra- 
phiques ayant  chacun  leur  signification  propre  et  ne  souf- 
frant de  comparaison  avec  aucun  autre. 

IV.  —  La  statistique  graphique  comme  instrument  d'investigation. 

392.  La  statistique  graphique  peut  aussi  servir  d'in- 
strument d'investigation  et  se  substituer  au  calcul.  Nous 
passerons  en  revue  quelques-unes  des  principales  applica- 
tions qui  ont  été  faites  de  cette  propriété  des  graphiques. 

A.  —  Méthode  graphique  des  pourcentiles  de  Sir  F.  Galton. 

Dans  son  ouvrage  «  Natural  inheritance  »,  Sir  F.  Galton 
a  exposé  une  méthode  qu'il  appelle  «  méthode  des  percen- 
tiles  »,  pour  arriver  rapidement  à  la  détermination  gra- 
phique des  quartiles  et  de  la  médiane.  Bien  que,  sous  cer- 
tain aspect,  ce  procédé  se  rattache  directement  à  la  mesure 
de  dispersion  interquartile,  la  méthode  de  Galton  ne  peut 
être  confondue  avec  la  matière  exposée  sous  le  n°  287,  à  rai- 
son de  la  portée  plus  générale  que  lui  a  donnée  son  illustre 
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auteur  :  les  services  que  peut  rendre  La  courbe  galtonienne 
vont  bien  au  delà,  en  effet,  de  la  détermination  de  la  mé- 
diane. 

Pour  construire  la  courbe  de  Galton,  on  procède  de  la 
sorte  : 

On  commence  par  dresser  le  tableau  numérique  des  don- 
nées à  utiliser,  par  exemple,  les  salaires  des  10,455  ouvriers 
(mâles)  de  plus  de  16  ans,  occupés  en  octobre  1903,  en  Bel- 
gique, dans  l'industrie  de  la  construction  de  machines  mo- 
trices, machines-outils  et  appareils  industriels. 

Pour  que  la  courbe  soit  tout  à  fait  exacte,  il  faut  que  la 
série  statistique  soit  complète,  c'est-à-dire  qu'elle  ne  com- 
prenne pas  de  classe  initiale  ou  terminale  en  renfermant 
plusieurs  qui  restent  indéterminées. 

Dans  la  première  colonne,  on  porte  le  taux  des  salaires, 
dans  la  deuxième  le  nombre  d'ouvriers  gagnant  le  salaire 
indiqué  en  regard,  dans  la  troisième  la  proportion  de 
chaque  groupe  au  total,  dans  la  quatrième  on  additionne 
l'un  à  l'autre  les  pourcentages  inscrits  à  la  troisième  co- 
lonne en  marquant  chaque  fois  le  résultat  de  l'addition. 

Le  tableau  ci-après  contient  les  données  statistiques  et  le 
résultat  des  calculs  en  ce  qui  concerne  les  10,455  ouvriers  de 
l'industrie  de  la  construction  de  machines  dont  les  salaires 
ont  été  relevés  en  1903  : 
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Salaires  de  10,455  ouvriers  mâles  de  plus  de  16  ans  dans  l'in- 
dustrie de  la  construction  de  machines  motrices,  machines- 
outils  et  appareils  industriels  en  Belgique  (matériel  extrait  de 
«  Salaires  et  durée  du  travail  dans  les  Industries  des  métaux  au  mois  d'octo- 
bre 1903  ».  Publication  de  l'office  du  travail  de  Belgique,  Bruxelles.  1907). 
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0,040 

99,713 

»    8.25       »  8.49 

3 

0,029 

99,742 

»    8.50       »  8.74 

1 

0,009 

99,751 

»    8.75       »   8  99 

2 

0,019 

99,770 

»    9.00       ii  9.24 

2 

0,019 

99,789 

»    9.25       »  9.49 

1 

0,009 

99,798 

»    9  50       »   9  74 

1 

0,009 

99,807 

)>    9.75       »  9.99 

3 

0,029 

99,836 

»  10.00       »  10.24 

3 

0,029 

99,865 

»  10.25       »  10  49 

1 

0,009 

99,874 

»  10.50       »  10.74 

5 

0,047 

99,921 

»  10.75       »  10.99 

0 

0,000 

»  11.00       »  11.24 

6 

0,060 

99,981 

»  11  25       »  11  49 

0 

0,000 

»  11  50       »  11  74 

0 

0,000 

»  11  75       »  11.99 

1 

0.009 

99,990 
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Sur  une  feuille  de  papier  quadrillé,  nous  reportons  en- 
suite les  mesures  suivantes  :  d'abord  nous  traçons  une 
ligne  horizontale  d'une  longueur  convenable;  cette  ligne  re- 
présente l'ensemble  des  parts  proportionnelles,  donc 
100.00;  Galton  les  appelle  «  grades  ».  Cette  ligne  est  divi- 
sée de  10  en  10  parties  et  si  l'on  peut  se  servir  de  papier 


Fig.  42. 

millimétrique  il  est  bon  d'admettre  que  1  mm.  ou  2  mm. 
correspondent  à  1  p.  c. 

On  élève  ensuite  à  droite  et  à  gauche  une  ligne  verticale 
sur  laquelle  on  porte  les  taux  des  salaires;  on  tiendra 
compte  de  la  hauteur  totale  à  donner  à  l'échelle  et  on  divi- 
sera cette  hauteur  en  parties  égales  d'après  les  variables 
du  taux  des  salaires. 

Revenant  à  la  ligne  horizontale,  on  élèvera  sur  cette 
ligne  une  perpendiculaire  à  l'endroit  correspondant  au 
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chiffre  des  pourcentages  accumulés,  d'abord  pour  la  pre- 
mière donnée,  puis  pour  la  seconde,  etc.  La  hauteur  de  ces 
lignes  devra  correspondre  au  taux  de  salaire  en  rapport 
avec  la  donnée,  l'échelle  placée,à  droite  ou  à  gauche  guide 
le  dessin  à  cet  égard.  Du  sommet  de  ces  perpendiculaires  on 
tirera  des  lignes  horizontales  de  façon  à  former  autant  de 
rectangles.  Enfin,  les  angles  de  gauche  des  rectangles  se- 
ront joints  par  une  courbe  partant  de  l'origine  la  plus  ré- 
gulière possible. 

Pour  déterminer  le  salaire  médian,  il  suffit  alors-  d'éle- 
ver du  point  50,  sur  la  ligne  horizontale  une  perpendicu- 
laire qui  s'arrête  à  la  courbe;  on  lira  sur  l'échelle  des  sa- 
laires, à  la  même  hauteur,  le  chiffre  du  salaire  médian  ;  on 
opère  de  même  pour  les  quartiles  en  élevant  les  perpendi- 
culaires respectivement  aux  points  25  et  75; 

Tout  point  quelconque  peut  être  connu  immédiatement 
par  une  simple  lecture.  De  cette  façon,  on  pourra  non  seu- 
lement fixer  la  position  de  la  médiane  et  des  quartiles, 
mais  encore  celle  des  déciles  et  des  percentiles.  La  figure  a 
donc  une  grande  puissance  représentative. 

B.  —  Méthode  graphique  pour  la  recherche  de  la  médiane, 

de  M.  Yule. 

393.  Nous  avons  vu  que,  dans  le  calcul  de  la  médiane,  il 
y  avait  lieu  de  procéder  à  une  interpolation  arithmétique 
afin  de  localiser  la  médiane  exactement  à  l'endroit  qui  lui 
convient  entre  les  intervalles  de  classes.  M.  Yule  a  montré 
que  par  la  construction  d'une  figure  graphique  très  simple 
on  pourrait  rapidement  trouver  la  médiane  sans  recourir 
à  aucune  interpolation  (1).  Le  procédé  qu'il  emploie  à  cet 
effet  peut  être  décrit  comme  suit  :  sur  une  feuille  de  papier 
quadrillé,  portez  en  abscisses  les  divisions  de  classe  et  en 
ordonnées  le  nombre  des  fréquences,  notez  au  moyen  d'un 


(1)  G.  U.  Yui,e,  An  introduction  to  the  theory  of  statistics,  p.  118. 
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point  l'endroit  précis  des  fréquences  comprises  entre 
chaque  classe;  réunissez  ces  points  par  une  ligne  courbe  à 
l'aide  d'un  instrument  approprié;  ensuite,  sur  l'axe  des  or- 
données marquez  un  point  correspondant  au  nombre  total 
de  fréquences  divisé  par  2  (j)  ;  de  ce  point,  tirez  une  ligne 
horizontale  par  rapport  à  l'axe  des  abcisses  :  le  point  où 
la  ligne  courbe  coupe  cette  ligne  horizontale  correspond  à 
la  médiane,  dont  vous  lirez  la  valeur  sur  l'axe  des  abcisses 
à  l 'endroit  indiqué  par  une  ligne  verticale  menant  du  point 
de  rencontre  à  l'axe  des  abcisses.  D'après  M.  Yule,  ce  pro- 
cédé donne  un  résultat  tellement  précis  qu'il  dispense  le 
plus  souvent  de  tout  calcul  arithmétique  et  notamment  du 
calcul  d'interpolation  auquel  il  faut  avoir  recours  d'habi- 
tude. 

C.  —  Méthode  graphique  pour  la  recherche  du  degré 
de  corrélation  de  Sir  Francis  Galton. 

394.  Comme  illustration  de  l'emploi  de  la  méthode  gra- 
phique en  vue  de  la  recherche  d'un  résultat  statistique,  on 
peut  encore  citer  la  méthode  graphique  de  Galton,  dans  la 
recherche  de  la  corrélation  entre  deux  phénomènes  donnés. 
Le  premier  point  consiste  à  déterminer  quel  est  celui  des- 
deux  phénomènes  qui  sert  de  mesure  à  l'autre  :  le  choix  dé- 
pend avant  tout  de  la  logique;  s'il  s'agit  d'un  exemple  em- 
prunté aux  sciences  sociales  on  soumettra  le  cas  à  une  ana- 
lyse économique  serrée.  Après  avoir  arrêté  quel  est  le  phé- 
nomène principal  ou  étalon  et  lequel  est  le  relatif,  on 
cherche  de  part  et  d'autre  la  moyenne  et  l'on  transforme  en 
une  série  d'index-numbers,  calculés  par  rapport  à  la 
moyenne,  les  données  primitives.  Les  index-numbers  étant 
obtenus,  on  peut  procéder  à  la  recherche  graphique  du  coef- 
ficient de  covariation.  On  portera  en  ordonnée  l'échelle  des 
index  du  fait  principal  et  en  abcisses  ceux  du  fait  relatif  : 
l'échelle  sera  graduée  de  manière  à  avoir,  de  part  et 
d'autre,  le  même  intervalle  de  classe.  Toutes  les  données  de 
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l'index  du  fait  principal  seront  ensuite  dépouillées  et  loca- 
lisées sur  le  diagramme,  en  tenant  compte  de  la  donnée  in- 
scrite en  regard  pour  le  phénomène  relatif.  Ainsi  la  don- 
née 56,  valeur  d'un  indice  de  la  donnée  principale,  combi- 
née avec  la  valeur  97,  indice,  pour  la  même  année,  du  phé- 
nomène relatif,  signifie  qu'il  faudra  porter  sur  le  dia- 
gramme un  signe  distinctif  à  l'intersection  de  l'ordonnée  56 
avec  l'abcisse  97.  En  général,  les  points  correspondant  à 
l'emplacement  des  données  ont  une  tendance  à  se  grouper 
vers  la  gauche  du  graphique.  Après  l'inscription  de  toutes 
les  valeurs  de  l'index  du  phénomène  principal,  on  trace  à 
travers  le  diagramme  une  droite  inclinée  à  45°,  qui  est  ap- 
pelée ligne  d'égale  variation;  puis  on  trace  une  seconde 
ligne,  nommée  ligne  de  régression,  de  manière  à  ce  qu'elle 
suive  le  plus  exactement  possible  la  direction  générale  indi- 
quée par  l'emplacement  des  signes  distinctif  s  sur  le  dia- 
gramme :  la  direction  est  exactement  donnée  lorsque  ces 
signes  distinctifs  sont  groupés  le  long  de  la  ligne,  ou  quand 
la  ligne  de  régression  en  laisse  autant  à  droite  qu'à  gauche. 
Plus  les  lignes  d'égale  variation  et  de  régression  sont  rap- 
prochées, plus  le  degré  de  covariation  des  deux  phénomènes 
est  élevé.  Pour  calculer  ce  degré  de  covariation,  il  faut,  d 'un 
point  de  l'axe  des  ordonnées,  mesurer  une  droite  A  B  paral- 
lèle à  l'axe  des  abcisses,  coupant  les  lignes  de  régres- 
sion et  d'égale  variation.  On  obtient  ainsi  une  figure  trian- 
gulaire renversée  dont  la  base  est  la  ligne  susdite  A  B,  le 
grand  côté  la  ligne  de  régression  (A  C)  et  l'autre  côté  la 
ligne  verticale  des  ordonnées  (B  C).  On  a  alors  la  propor- 
tion ,  ou  la  tangente  de  la  figure  triangulaire  décrite 
par  la  droite  menée  de  l'axe  des  ordonnées,  cet  axe  des  or- 
données lui-même  et  la  ligne  de  régression  depuis  son  ori- 
gine jusqu'au  point  d'intersection  A. 

La  valeur  de  A  B  et  de  B  C  se  mesure  facilement  en  te- 
nant compte  du  nombre  de  classes  et  de  la  valeur  de  l'in- 
tervalle de  classe.  La  fraction  -~  représente  le  degré  de 
covariation  ;  si  elle  est  de  0.80  par  exemple,  elle  signifie  que 
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pour  tout  changement  du  fait  principal,  changement  équi- 
valant à  l'unité,  il  y  a  un  changement  du  phénomène  rela- 
tif équivalant  à  80  p.  c.  du  changement  type  du  fait  princi- 
pal. L'équation  de  régression  est  représentée  par  la  diffé- 
rence de  l'équation  de  covariation  par  rapport  à  l'unité, 
soit  dans  le  cas  imaginé  plus  haut,  0.20  p.  c.  (1). 
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LIVRE  III 


LA  LOI  DES  ERREURS 

j  I.  —  Définitions  et  généralités. 

396.  Dans  le  langage  mathématique,  on  donne  le  nom 
d'erreur  à  la  différence  entre  une  quantité,  d'ordinaire 
inconnue,  mais  tenue  pour  exacte,  et  l'évaluation  qu'on  en 
fait.  L'erreur  mathématique  est  donc  le  résultat  d'une  ob- 
servation mal  faite.  On  distingue  l'erreur  absolue  qui,  par 
excès  ou  défaut,  est  commise  par  rapport  à  un  nombre  et  est 
considérée  en  elle-même,  sans  avoir  égard  à  ce  nombre;  on 
distingue  encore  l'erreur  relative,  qui  exprime  le  rapport 
de  l'erreur  elle-même  au  nombre  d'après  lequel  elle  est 
estimée;  l'erreur,  divisée  par  le  nombre  exact,  a  pour 
résultat  l'erreur  relative.  La  théorie  des  erreurs  forme  une 
partie  intéressante  des  mathématiques  et  elle  est  à  la  base 
de  la  théorie  des  probabilités.'  Le  langage  philosophique 
donne  au  mot  erreur  un  sens  différent  de  celui  qui  vient 
d'être  exposé  :  l'erreur  consiste  à  affirmer  comme  vraie 
une  chose  qui  n'est  pas,  ou  à  nier  une  chose  qui  est.  L'er- 
reur philosophique  n'est  pas  sujette  à  mesure;  elle  ne  com- 
porte pas  une  série  de  degrés  susceptibles,  dans  leur  gran- 
deur et  leur  arrangement,  d 'obéir  à  une  certaine  loi  ;  par  là, 
elle  diffère  essentiellement  de  ce  qu'on  appelle  <(  erreur  » 
dans  les  sciences  mathématiques.  La  statistique  donne  un 
sens  spécial  aux  mots  «  erreur  »  et  <(  loi  des  erreurs  »,  — 
nous  verrons  plus  loin  en  quoi  ce  sens  est  spécial  ;  notons 
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cependant  que  le  sens  attribué  à  ces  mots  par  la  statistique 
se  rapproche  très  sensiblement  de  celui,  du  terme  «  erreur  » 
en  termes  mathématiques. 

La  «  loi  des  erreurs  »  est  une  formule  qui  désigne  en 
abrégé  certaines  propriétés  des  erreurs,  notamment  celle 
d'obéir  à  des  groupements  systématiques. 

Elle  porte  plusieurs  noms,  sous  lesquels  elle  est  indiffé- 
remment désignée  :  loi  des  grands  nombres,  loi  de  Gauss, 
courbe  de  probabilité,  etc.  Nous  conserverons  au  cours  de 
cet  exposé,  la  dénomination  de  «  loi  des  erreurs  »  — 
parce  qu'elle  est  la  plus  compréhensive  et  la  plus  exacte 
de  celles  proposées. 

397.  Avant  d'aborder  l'examen  du  fond,  il  nous  faut 
expliquer  le  sens  statistique  du  mot  «  erreur  »  et  justifier 
l'emploi  de  l'expression  :  «  loi  des  erreurs  ». 

«  Aucune  observation,  écrit  Bertrand,  n'est  certaine, 
mille  opérations  successives  donnent  mille  résultats  diffé- 
rents. Non  que  l'observateur,  de  mieux  en  mieux  instruit, 
corrige  ses  défauts  et  s'avance  vers  la  perfection.  Il  n'en 
est  pas  ainsi.  Les  derniers  résultats  ne  ressemblent  en  rien 
à  une  limite  dont  on  s'approcherait  par  continuel  progrès; 
les  évaluations,  tantôt  trop  petites,  tantôt  trop  grandes,  se 
succèdent  en  confusion  et  sans  ordre  comme  des  boules 
blanches  ou  noires  puisées  dans  une  urne.  » 

Bertrand,  dans  ce  passage,  attire  l'attention  sur  un  fait 
remarquable,  à  savoir  que  les  erreurs  se  succèdent  sans 
ordre;  il  ne  s'agit  pas  d'une  suite  d'erreurs  qui,  considé- 
rables au  début  à  cause  de  l'inexpérience  de  l'opérateur, 
iraient  en  diminuant  au  fur  et  à  mesure  que  l'habileté  de 
l'observateur  irait  en  augmentant;  il  semble  que  le  hasard 
seul  règle  la  fréquence  et  la  grandeur  des  erreurs.  S'il  exis- 
tait, parmi  les  causes  d'erreur,  des  motifs  permanents  de 
se  tromper,  les  erreurs  resteraient  constantes  et  se  fixe- 
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raient  dans  le  même  sens;  mais  à  côté  de  ces  erreurs,  on 
conçoit  parfaitement  qu'il  puisse  en  exister  qui  ne  se  pré- 
sentent qu'occasionnellement.  De  là  la  division  des  erreurs 
en  erreurs  systématiques  et  erreurs  accidentelles  (1). 

Les  erreurs  systématiques  sont  celles  qui  sont  sujettes  à 
répétition  dans  un  sens  connu;  elles  sont  personnelles  si 
elles  tiennent  à  Ja  personne  même  de  l'observateur,  instru- 
mentales si  elles  sont  dues  à  une  particularité  de  l'instru- 
ment employé  dans  l'observation,  théoriques  si  elles  dé- 
rivent de  certaines  causes  dont  les  conséquences  peuvent 
se  peser  à  l'avance.  Les  erreurs  personnelles  sont  la  con- 
séquence de  ce  qu'on  appelle  «  l'équation  personnelle  »  de 
l'opérateur;  les  erreurs  instrumentales  se  retrouvent  dans 
les  mesures  physiques  où  l'on  fait  usage  d'instruments 
compliqués  et  délicats;  en  statistique,  ces  deux  catégories 
d'erreurs  n'ont  guère  l'occasion  de  se  produire;  cependant, 
on  pourrait  assimiler  à  une  erreur  instrumentale  celle  qui 
résulte,  dans  un  travail  d'investigation  statistique,  d'une 
question  mal  posée,  d'instructions  incomplètes  ou  peu 
claires,  d'une  méthode  vicieuse  ;  il  est  vrai  qu'on  peut  aussi, 
pour  de  bonnes  raisons,  les  ranger  parmi  les  erreurs  théo- 
riques (2). 

Disons  immédiatement  que  ce  n'est  pas  des  erreurs  systé- 
matiques, quelle  que  soit  leur  origine,  qu'il  s'agit  dans  la 
«  loi  des  erreurs  ».  Elles  sont  exclues  par  définition  du  cal- 
cul des  probabilités,  lequel  ne  s'applique  qu'aux  seules 
erreurs  accidentelles. 

On  entend  par  erreurs  accidentelles,  celles  qui  se  pré- 
sentent encore  dans  les  observations  les  plus  soigneuse- 
ment purgées  de  toute  erreur  systématique.  «  Les  erreurs 
accidentelles,  dit  Gruey,  ne  sont  liées  par  aucune  loi  aux 


(1)  On  dit  aussi  «  erreurs  régulières  »  au  lieu  de  «  erreurs  systématiques  ». 

(2)  Il  est  superflu  de  faire  remarquer  qu'une  série  de  mesures  affectée 
d'erreurs  régulières  ou  systématiques  doit  être  immédiatement  rejetée. 
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observations  et  ne  peuvent  être  calculées  a  priori.  N'étant 
pas  calculables  a  priori  à  cause  de  la  nature  capricieuse 
et  irrégulière  des  causes  qui  les  produisent,  elles  tombent 
dans  le  domaine  du  calcul  des  probabilités  (1).  » 

Le  fait  que  les  erreurs  accidentelles  sont  soumises  aux 
règles  du  calcul  des  probabilités  résulte  du  théorème  de 
Bernouilli  dont  nous  parlerons  plus  loin  ;  mais  auparavant, 
il  est  permis  d'invoquer  l'expérience  et  il  n'est  pas  inutile, 
pour  préciser  les  idées,  d'exposer  à  l'intention  du  lecteur 
quelques  faits  à  l'appui  de  l'affirmation  qui  précède. 

L'astronome  anglais  James  Bradley  (1693-1762)  ayant 
mesuré  470  fois,  avec  toute  la  précision  possible,  le  même 
intervalle  de  temps,  il  se  trouva  que,  malgré  le  soin  avec 
lequel  elles  avaient  été  exécutées-,  ces  observations  étaient 
encore  entachées  d'erreurs,  les  unes  ayant  dépassé  le  temps 
moyen,  les  autres  étant  restées  en  deçà  :  ainsi,  lorsque  Bes- 
sel  en  fit  le  classement,  il  trouva  que  : 

94  observations  présentaient  une  erreur  comprise  entre  0.0  et  0.1 
88        »  »  »  »  0.1  et  0.2 

78        »  »  »  »  0.2  et  0.3 

et  ainsi  de  suite  jusqu'à  une  erreur  de  0.9  à  1.0,  le  nombre 
des  erreurs  allant  en  diminuant  au  fur  et  à  mesure  que  leur 
importance  augmentait. 


(1)  Cette  observation  est  exacte  au  point  de  vue  subjectif,  mais  il  semble 
que  l'analyse  est  poussée  plus  loin  par  M.  Mansion  lorsqu'il  écrit  :  «  les 
erreurs  irrégulières,  accidentelles  ou  fortuites  considérées  objectivement  se 
reproduisent  identiquement  dans  les  mêmes  circonstances,  absolument  comme 
les  erreurs  régulières;  autrement  dit,  en  soi,  toutes  les  erreurs  sont  régu- 
lières. Mais  subjectivement,  par  rapport  à  nous,  il  n'en  est  pas  de  mêm  2  : 
lorsque  nous  croyons  que  les  circonstances  sont  les  mêmes,  elles  ont  changé, 
mais  trop  peu  pour  que  nous  puissions  le  savoir;  il  y  a  de  petites  causes 
d'erreur,  agissant  avec  une  égale  facilité  dans  tous  les  sens,  qui  introduisent 
des  erreurs  que  nous  ne  pouvons  pas  constater.  Ce  sont  les  erreurs  que  l'on 
appelle  irrégulières,  accidentelles  ou  fortuites.  »  Boudin-Mansion,  loc.  cit. 
p.  154. 
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Un  exemple  à  peu  près  analogue  a  été  donné  par  Que- 
telet  :  utilisant  plusieurs  centaines  d'observations  laites 
à  l'Observatoire  de  G reenwich,  entre  183(5  et  1839,  Quetelet 
a  trouvé  que  les  résultats  de  l'observation  s'écartent  de  la 
moyenne  à  raison  de  certaines  circonstances  faisant  naître 
des  erreurs  accidentelles.  Les  observations  dont  Quetelet  a 
fait  usage  sont  tirées  des  publications  de  l'Observatoire 
royal  de  Greenwich  et  concernent  les  déterminations  en 
temps  de  l'ascension  droite  de  la  polaire,  ces  mots  ascen- 
sion droite  signifiant  la  distance  de  l'astre  au  point  équi- 
noxial,  mesurée  le  long  de  l'équateur  céleste;  ces  observa- 
tions, comme  le  fait  remarquer  Quetelet,  ont  subi  diffé- 
rentes corrections  pour  la  nutation,  la  précession,  etc.,  et 
ont  été  calculées  pour  une  même  époque,  en  sorte  qu'elles 
ne  diffèrent  que  par  les  effets  des  petites  erreurs  acciden- 
telles (1). 

Le  tableau  dressé  par  Quetelet  montre  que  sur  487  obser- 
vations il  se  trouve  : 

145  observations  présentant  une  erreur  comprise  entre  0.0  et  0.5 


124  «  »  »  »  0.5  et  1.0 

74  »  »  »  »  1.0  et  1.5 

37  »  »  »  »  1.5  et  2.0 

H  »  »  »>  »  2.0  et  2.5 

2  »  »  »  »  2.5  et  3 


82  observations  correspondaient  exactement  à  la  moyenne 
et  ne  présentaient  par  conséquent  aucune  erreur  appré- 
ciable. 

On  voit,  d'après  ce  qui  précède,  que  la  détermination  de 
l'importance  et  du  sens  des  erreurs  dans  les-  mesures  expé- 
rimentales se  fait  en  comparant  chaque  résultat  à  la 


(1)  Quetelet  :  Lettres  sur  la  théorie  des  prohabilités,  pp.  125-12(5. 
Bruxelles,  1846. 
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moyenne  calculée  sur  l'ensemble  des  observations.  Ainsi, 
pour  470  observations  faites  par  Bradley  pour  la  déclinai- 
son d 'une  étoile,  la  valeur  fixe  adoptée  pour  la  déclinaison 
est  la  moyenne  de  toutes  les  observations  faites  ;  les  écarts, 
c'est-à-dire  les  différences  entre  cette  moyenne  et  chaque 
résultat  particulier  ont  été  calculés  avec  une  grande  préci- 
sion, puis  ils  ont  été  classés  suivant  une  échelle  dont  chaque 
division  correspond  à  0",4  (1).  Le  même  procédé  a  été  appli- 
qué par  Quetelet  aux  calculs  de  l'ascension  droite  de  la  po- 
laire, mais  avec  une  plus  large  approximation. 

398.  Pourquoi  admet-on  que  la  moyenne  puisse  servir  à 
déterminer  l'erreur  de  toute  observation  particulière?  C'est 
parce  que,  comme  nous  l'avons  démontré  plus  haut, 
entre  toutes  les  mesures  prises  d'un  phénomène  quel- 
conque, la  moyenne  constitue  la  valeur  la  plus  exacte. 
Le  lecteur  devra  se  référer  à  l'application  donnée  anté- 
rieurement, mais  pour  encore  préciser  ses  idées  à  ce  sujet, 
nous  reprendrons  une  explication  sommaire  que  nous  em- 
pruntons à  M.  Thomas  Wallace  Wright  et  qui  a  le  grand 
mérite  de  la  simplicité  (2). 

Supposons  que  x  soit  la  quantité  à  mesurer  et  que  d  soit 
le  résultat  de  l'observation. 

S'il  n'y  a  aucune  erreur  dans  l'observation  faite,  on  a 

x  —  d  =  0 

Mais  si,  après  avoir  fait  plusieurs  observations  de  cette 
même  quantité,  nous  trouvons  que  les  mesures  obtenues  dif- 
fèrent entre  elles,  nous  devons  conclure  nécessairement  que 
plusieurs  d'entre  elles  sont  inexactes;  désignons  par  la 


(  1  )  K  Carvallo  :  Le  calcul  des  probabilités  et  ses  applications,  p.  90, 
Paris-Gauthier -Villars,  1912. 

(2)  Th.  Wallace  Wright  :  The  adjustment  of  observations,  2e  édit . , 
London  et  New- York,  1906,  p.  9  et  suiv. 
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lettre  /\  les  erreurs  d'observation  et  affectons  chaque  ré- 
sultat d'observation  et  chaque  écart  ou  erreur  d'un  indice 
permettant  de  les  reconnaître;  nous  avons  alors  : 

x  —  di  —  ^ 

x  —  d%  =  ^2  (81, 
x  -  d3  =  /\3 

X  —  dn  ==  Aw 

La  valeur  à  chercher  est  la  véritable  signification  de  d  et 
nous  devons  admettre  que  cette  valeur  doit  être  considérée 
comme  une  fonction  des  résultats  fournis  par  l'observation: 
elle  est  comprise  entre  la  valeur  la  plus  élevée  fet  la 
valeur  la  moins  élevée  de  d.  On  peut  admettre  que  si  ces 
valeurs  étaient  rangées  par  ordre  d'importance,  la  valeur 
idéale  se  trouverait  vers  le  centre,  au  point  également  éloi- 
gné des  deux  extrêmes,  c'est-à-dire  à  la  valeur  centrale  si 
le  nombre  des  observations  est  impair,  et  aux  deux  valeurs 
centrales  si  le  nombre  d'observations  est  pair;  le  lecteur 
voudra  bien  se  rappeler  ce  que  nous  avons  dit  plus  haut  au 
sujet  de  la  médiane.  Bien  entendu,  nous  devons  supposer 
toujours  que  toutes  les  observations  sont  également  dignes 
de  foi  et  qu'aucune  d'entre  elles  n'est  entachée  d'une  erreur 
systématique;  nous  sommes  et  nous  devons  rester  dans  le 
domaine  des  erreurs  accidentelles.  Or,  la  fonction  symé- 
trique la  plus  simple  qui  puisse  être  choisie  pour  x0  repré- 
sentant la  fonction  symétrique  de  oc,  est  la  moyenne  arith- 
métique 

(d,  +  d«  +  rf3....+rfw)  S(rf) 
ii  n 

d'où  il  suit  que,  entre  toutes  les  valeurs  fournies  par  l'ob- 
servation, la  plus  exacte  est  celle  qui  est  fournie  par  la 
moyenne  arithmétique  des  résultats  livrés  par  l'observa- 
tion. 
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399.  Nous  nous  sommes  placé  jusqu'à  présent  dans 
l'hypothèse  de  mesures  idéales  ayant  rapport  à  des  nombres 
déterminés  par  l'analyse  mathématique,  ou  à  des  mesures 
réelles,  expérimentales,  ayant  trait  à  des  phénomènes  natu- 
rels. Mais  nous  sommes,  ne  l'oublions  pas,  dans  le  domaine 
des  faits  concrets,  dans  le  domaine  de  la  statistique  et  une 
question  importante  se  pose  à  l'instant  :  de  quel  droit 
transpose-t  on  dans  ce  domaine  de  la  statistique  les  for- 
mules et  les  théorèmes  reconnus  exacts  dans  la  sphère  du 
calcul  pur  ou  dans  celle  des  observations  relatives  aux  phé- 
nomènes naturels?  La  question  nous  semble  intéressante  et 
vaut  qu'on  s'y  arrête  un  instant.  Déjà  Jacques  Bernouilli 
avait  aperçu  que  le  calcul  des  probabilités  s'étendait  à  d'au- 
tres matières  que  celle  des  jeux  de  hasard  :  la  4e  partie  de 
son  «  Ars  conjectandi  ))  a  en  effet  pour  titre:  «  De  l'emploi 
et  de  l'application  de  la  doctrine  précédente  dans  les  ma- 
tières civiles,  morales  et  économiques  »,  mais  la  mort  n'a 
pas  permis  au  grand  mathématicien  d'énoncer  ses  vues  au 
sujet  de  l'application  des  probabilités  au  vaste  domaine 
qu'il  assignait  à  sa  «  doctrine  ».  Un  fait  d'expérience, 
d'une  portée  considérable,  est  qu'un  grand  nombre  de  phé- 
nomènes naturels  ont  une  distribution  autour  de  la 
moyenne  telle  que  leurs  éléments  semblent  être  rassemblés 
par  l'effet  du  hasard;  on  pourrait  presque  les  assimiler 
aux  boules  blanches  ou  noires  tirées  hors  d'une  urne,  dont 
la  loi  de  sortie  est  déterminée  par  le  calcul  des  probabilités. 
Citons  une  fois  encore  les  chiffres  relatifs  à  la  taille  de  8,585 
adultes  mâles  nés  en  Angleterre,  Irlande,  Ecosse  et  Pays  de 
Galles,  d'après  le  rapport  final  de  la  commission  d'anthro- 
pométrie adressé  à  la  British  Association  (rapport  de  1883, 
cité  par  M.  G.  11.  Yule,  p.  88)  : 
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16 

76 

1 

4 

5 

77 

1 

1 

2 

Totaux 

6194 

1304 

741 

346 

8585 

La  distribution  par  grandeur  de  taille  n'est  pas  identique 
à  celle  d'une  distribution  symétrique  idéale,  mais  il  faut 
reconnaître  qu'elle  s'en  rapproche  singulièrement.  La 
moyenne  est  localisée  entre  les  grandeurs  67  et  68  pouces, 
exactement  67, 46  correspondant  à  la  fréquence  la 
plus  élevée  :  1,329  individus.  Examinant  un  exemple  ana- 
logue, M.  Borel  suppose  que  l'on  mesure  la  taille  de  tous 
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les  Français  adultes  :  «  Si  l'on  convient,  dit-il,  de  consi- 
dérer la  valeur  moyenne  des  mesures  comme  la  valeur 
exacte  que  devrait  avoir  la  taille  d'un  Français,  on  con- 
state que  les  «  erreurs  »,  c'est-à-dire  les  différences  posi- 
tives ou  négatives  entre  cette  valeur  théorique  et  la  valeur 
réelle  se  répartissent  précisément  suivant  la  loi  de  Gauss  : 
tout  se  passe  comme  si  les  Français  avaient  tous  la  même 
taille,  égale  à  la  moyenne,  mais  étaient  mesurés  par  un 
expérimentateur  très  maladroit,  dont  les  erreurs  de  me- 
sure suivraient  la  loi  de  Gauss  (1).  » 

Des  exemples  de  ce  genre  peuvent  être  relevés  en  grand 
nombre  parmi  les  mesures  anthropométriques.  On  en  con- 
naît aussi  dans  le  domaine  des  sciences  zoologiques  et  bo- 
taniques; en  admettant  une  certaine  latitude  d'apprécia- 
tion, on  en  trouve  aussi  dans  la  sphère  des  phénomènes 
sociaux  :  il  ne  faut  pas  penser  que  la  courbe  des  salaires 
construite  en  tenant  compte  du  nombre  des  ouvriers  qui 
gagnent  un  salaire  d'un  certain  taux,  soit  absolument  irré- 
gulière; si  elle  n'épouse  pas  absolument  la  courbe  symé- 
trique idéale,  elle  s'en  rapproche  dans  une  mesure  assez 
notable  pour  que  cette  approximation  soit  de  nature  à  inté- 
resser vivement  les  esprits  réfléchis. 

Mais  il  s  'agit  de  ressemblance,  de  rapprochement  et  non 
de  similitude.  Les  phénomènes  humains,  a  dit  quelque  part 
Borel,  ressemblent  à  la  loi  des  erreurs,  à  peu  près  comme 
une  orange  ressemble  à  une  figure  géométrique  idéale,  la 
sphère.  Et  la  ressemblance  subit  une  sorte  de  dégradation 
à  mesure  qu'on  s'élève  dans  l'échelle  des  êtres  ou  qu'il 
s'agit  de  manifestations  de  plus  en  plus  conscientes.  Il  ne 
peut  donc  être  question  d'expliquer  par  la  loi  des  erreurs 
tous  les  phénomènes  qui  se  présentent  d'après  un  plan  plus 
ou  moins  analogue  ;  il  est  seulement  légitime,  pour  certains 
d'entre  eux,  de  les  rapprocher  des  types  géométriques  de 


(1)  Emit.e  Bontx,  Eléments  de  la  théorie  des  probabilités,  p.  184,  Paris, 
A.  Herman  et  Fils,  1909. 
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distribution,  et  pour  d'autros  d'aller  plus  loin  et  de  calcu- 
ler, d'après  les  méthodes  qui  seront  indiquées  ci-apn'S 
le  degré  de  probabilité  qu'ils  présentent.  Les  phénomènes 
sociaux,  particulièrement,  ne  peuvent  être  interprétés 
qu'avec  beaucoup  de  précaution.  On  sait  que  Quetelet  ima- 
ginait une  assimilation  systématique  dés  faits  naturels  à  la 
loi  des  erreurs.  L'illustre  statisticien  était  tenté  de  voir 
dans  la  nature  une  urne  dont  la  composition  est  inconnue; 
blanches  ou  noires,  les  boules  tirées  apparaissent  dans  un 
désordre  apparent,  et,  en  effet,  les  événements  de  la  vie,  par 
leur  bizarrerie  et  leur  caractère  inattendu,  semblent  échap- 
per à  toute  prévision.  Mais  la  loi  des  erreurs  rend  compte 
des  raisons  de  leur  sortie,  et  après  qu'ils  ont  été  convena- 
blement classés,  l'ordre  le  plus  parfait  règne  parmi  des 
événements  qui  ne  paraissent  obéir  à  aucune  tendance  sys- 
tématique. Ce  système  philosophique  a  pour  lui  un  certain 
nombre  de  faits  impressionnants,  mais  il  en  a  tout  autant 
contre  lui.  Ce  qu'il  importe  de  retenir,  c'est  que  la  loi  des 
erreurs  est  d'une  importance  capitale,  mais  qu'on  ne  sau- 
rait, sans  tomber  dans  l'exagération,  l'étendre  à  tous  les 
phénomènes  et  systématiser  son  empire.  Pour  qu'elle  s'ap- 
plique aux  phénomènes,  ceux-ci  doivent  présenter  des  va- 
riations dues  à  des  circonstances  accidentelles  et  dès  lors 
soumises  au  calcul  des  probabilités  ;  cette  condition  exclut 
certains  faits  dans  lesquels  intervient  la  volonté  consciente 
de  l'homme  et  doit  nous  rendre  prudents  dans  l'examen  des- 
faits  économiques. 

II.  —  Notions  sur  les  probabilités. 

Théorème  de  Bernouilli.  —  Règle  des  écarts. 

400.  Si  nous  supposons  qu'un  événement  peut  se  pro- 
duire dans  x  cas  et  que  tous  ces  cas  sont  également  pos- 
sibles, nous  nous  trouvons  dans  les  conditions  voulues  pour 
définir  la  probabilité:  la  probabilité  d'un  événement  donné 
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s'exprime  par  le  rapport  des  cas  favorables  à  cet  événe- 
ment au  nombre  de  cas  possibles. 

On  vient  de  voir  que  la  définition  exige,  pour  le  calcul, 
la  connaissance  de  deux  points  importants  :  le  nombre  de 
cas  favorables  et  le  nombre  de.cas  possibles.  Pour  détermi- 
ner le  nombre  de  cas  également  possibles,  on  aura  recours 
au  calcul  des  combinaisons  dont  nous  avons  parlé  dans 
l'Introduction  à  ce  volume;  ce  calcul  est  souvent  laborieux 
et  la  manière  de  poser  le  problème  soulève  maintes  fois  de 
sérieuses  difficultés.  Le  calcul  des  probabilités  est  ardu,  non 
pas  tant  par  ses  difficultés  techniques,  qui  sont,  après  tout, 
une  affaire  de  formule,  que  par  la  difficulté  logique 
de  poser  le  problème  d'une  façon  exacte.  La  possibilité 
égale  des  événements  suppose  qu'on  procède  à  de  longs 
calculs  :  ainsi,  en  admettant  qu'on  joue  à  un  jeu  n'ad- 
mettant que  deux  alternatives,  tel  que  le  jeu  de  pile  ou  face, 
et  en  supposant  qu'on  se  livre  à  100  épreuves,  on  devra,  pour 
obtenir  le  -nombre  de  cas  également  possibles,  calculer  le 

m        (?)  p 

produit  de  100  multiplicateurs  égaux  à  2  (2  X  2  X  2  X 

(4)         (5)  (K'Oi  (]no) 

2  X  2  =  32  ...  X  2),  produit  qu'on  exprime  par  2.  On 
éprouve  les  mêmes  difficultés  de  calcul  en  ce  qui  regarde 
l'énumération  des  cas  favorables;  les  combinaisons  qu'on 
peut  obtenir  en  choisissant  x  cas  parmi  100  ou  200  objets 
donnés,  sont  excessivement  nombreuses;  nous  avons  dit 
plus  haut  que  la  formule  algébrique  qui  s'applique  à  ces 
cas  est  P  —  1.2.3...  n,  c'est-à-dire  que  chaque  produit  est 
multiplié  par  le  nombre  suivant,  jusqu'à  ce  qu'on  soit  ar- 
rivé au  chiffre  n;  si  n  =  21,  on  aura  Ix2  =  2;2x3  =  6; 
6  x  4  =  24;  ...  n  X  21  =  x. 

401.  La  probabilité  qui  vient  d'être  définie  s'appelle  pro- 
babilité a  priori  parce  qu'on  suppose  que  ses  éléments  sont 
connaissables,  sans  autre  recherche  que  celle  des  calculs; 
dans  le  jeu  de  pile  ou  face,  par  exemple,  on  sait  qu'il  n'y  a 
d'autre  alternative  que  d'obtenir  pile,  ou  d'obtenir  face; 
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au  jeu  de  dé,  comme  il  y  a  six  faces  portant  chacune  un 
numéro,  on  sait  d'avance  que  le  cas  favorable  à  la  sortie 
de  l'un  de  ces  numéros  est  de  1/6,  on  supposant,  bien  en- 
tendu, que  le  dé  ne  soit  pas  faussé. 

Mais  il  est  une  autre  espèce  de  probabilité  qu'on  appelle 
probabilité  a  posteriori  et  à  laquelle  on  pourrait  aussi  don- 
ner le  nom  de  probabilité  statistique,  tant  elle  est  fréquente 
dans  le  domaine  de  cette  méthode  scientifique.  Si,  dans  cer- 
taines hypothèses,  empruntées  au  jeu  le  plus  sou- 
vent, on  peut,  à  l'avance,  faire  connaître  les  condi- 
tions de  la  probabilité,  il  n'en  est  pas  de  même  dans  la  plu- 
part des  événements  de  la  vie. 

Pour  connaître  la  probabilité  qu'une  naissance  soit  mas- 
culine, plutôt  que  féminine,  il  a  fallu  évidemment  noter  le 
sexe  de  l'enfant  dans  un  grand  nombre  de  naissances; 
pour  savoir  quelle  est  la  chance  qu'une  maison  brûle, 
qu'un  navire  périsse,  qu'un  accident  se  produise,  il 
a  été  nécessaire  d'observer  un  grand  nombre  de  sinistres 
et  de  comparer  leur  fréquence  à  la  totalité  des  cas  existants. 
Cette  recherche  est  faite  par  la  statistique,  et  la  probabilité 
qui  résulte  de  recherches  de  la  statistique  s'appelle  proba- 
bilité a  posteriori.  Sans  la  statistique,  on  ne  saurait  mesu- 
rer la  probabilité  des  événements  soumis  à  des  influences 
complexes  parce  que  le  nombre  de  cas  favorables  à  l'événe- 
ment ne  peut  alors  être  connu  que  par  l'observation. 

Tci,  encore,  il  convient  d'attirer  l'attention  sur  la  diffé- 
rence essentielle  entre  la  probabilité  statistique  et  la  proba- 
bilité a  priori  :  la  probabilité  statistique  ne  nous  donne 
qu'une  notion  approximative  qui  n'est  nullement  compa- 
rable aux  probabilités  abstraites  et  rigoureuses  auxquelles 
on  arrive  en  tablant  sur  les  résultats,  par  exemple,  du  jeu 
de  pile  ou  face  ou  sur  la  loi  de  sortie  des  boules  blanches  ou 
noires  d'une  urne  d'une  composition  connue.  La  probabi- 
lité statistique  n'est  qu'une  approximation  à  l'égard  de  la 
seconde. 
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402.  On  vient  de  voir  que  la  probabilité  s'exprime  par  le 
rapport  des  cas  favorables  aux  cas  possibles.  Mais  doit-on 
conclure  de  là  qu  'ayant  calculé  la  probabilité  sur  un  grand 
nombre  de  cas,  cette  même  probabilité  se  vérifiera  pour  cha- 
cune des  séries  qui  composent  ensemble  la  totalité  des  cas- 
possibles?  Le  bon  sens  se  refuse  à  l'admettre;  on  sait  très 
bien  que  la  probabilité  est  la  résultante  d'une  foule  de  cir- 
constances accidentelles  et  que  si  elle  est  vraie  pour  l'en- 
semble, elle  ne  l'est  certes  pas  pour  chacune  des  épreuves 
ou  des  séries  dont  se  compose  le  total.  On  ne  comprendrait 
pas  que  la  probabilité  devint  une  fatalité.  Dans  une  série 
de  100  épreuves  au  jeu  de  pile  ou  face,  la  fréquence  0,  c'est- 
à-dire  l'expression  fractionnaire  obtenue  en  divisant  le 
nombre  des  apparitions  de  l'événement  attendu  par  le 
nombre  de  cas  possibles  (0/100)  ne  se  présentera  pas,  car 
il  est  absolument  invraisemblable  que  sur  100  épreuves  on 
réussisse  à  obtenir  100  fois  pile  ou  100  fois  face,  selon  que 
l'on  aura  parié  pour  pile  ou  pour  face;  au  contraire  la  fré- 
quence 50/100  qui  représente  une  égale  probabilité  pour 
pile  et  pour  face  a  pour  elle  une  énorme  probabilité. 

En  procédant  par  voie  expérimentale  nous  obtiendrons 
donc  des  résultats  différents  pour  chacune  des  séries  par 
rapport  à  leur  fréquence;  les  unes  se  rapprocheraient 
d'une  manière  notable  de  la  probabilité  théorique  géné- 
rale, les  autres  s'en  éloigneraient  beaucoup.  La  probabilité 
et  la  fréquence,  fait  observer  Carvallo  dans  son  remar- 
quable exposé  (1),  sont  deux  termes  qui  ont  des  natures 
presque  opposées.  La  probabilité  a  un  caractère  spéculatif 
et  son  existence  objective  est  toujours  douteuse,  parce 
qu'on  n'est  jamais  certain  que  les  divers  cas  envisagés 
sont  également  possibles;  mais  supposez-vous  qu'ils  soient 
tous  possibles  au  même  degré,  parce  que,  par  exemple, 
l'opération  de  statistique,  l'observation  scientifique,  a  été 


(1)  Carvallo  :  Le  calcul  des  probabilités  et  ses  applications,  Paris, 
Oauthier-Villars,  1012,  p.  8. 
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laite  clo  bonne  foi.  par  un  homme  capable,  au  moyen  d'une 
bonne  méthode  et  avec  des  instruments  convenables,  il  faut 
admettre  que  la  probabilité  est  certaine  et  qu'à  mesure  que 
se  multiplieront  les  essais,  les  épreuves,  le  résultat  se  rap- 
prochera davantage  de  cette  probabilité.  Au  contraire,  la 
fréquence  a  une  valeur  objective,  mais  cette  valeur  est  in- 
certaine, elle  est  variable,  elle  change  dans  une  multitude 
de  cas  :  tantôt  elle  se  rapproche  de  la  probabilité,  tantôt 
elle  s'en  éloigne. 

De  là,  on  tire  une  nouvelle  notion,  celle  de  l'écart.  L'écart 
d'une  série  d'épreuves  est  la  différence  entre  la  probabi- 
lité théorique  de  l'événement  attendu  et  la  fréquence  de 
l'apparition  du  même  événement  dans  une  série  donnée 
d'observations  (1). 

De  même,  à  propos  de  la  moyenne,  on  appelle  écart,  dé- 
viation, la  différence  numérique  entre  tout  nombre  de  la 
série  et  la  moyenne.  Ici,  la  probabilité  est  la  moyenne,  la 
fréquence  est  la  valeur  attribuée  par  l'observation  dans 
chaque  cas  particulier,  et  l'écart,  dans  un  cas  comme  dans 
l 'autre,  est  la  différence  entre  ces  deux  termes. 

403.  Maintenant  essayons  d'introduire  une  nouvelle  no- 
tion. Ces  écarts,  —  qu'on  les  considère  à  propos  de  la 
moyenne  ou  de  la  probabilité,  peu  importe,  car  leur  nature, 
dans  les  deux  cas,  est  identique  — ,  ces  écarts  ont-ils  la 
chance  de  se  grouper  d'une  manière  systématique  autour 
de  la  valeur  à  laquelle  ils  se  comparent?  La  logique  semble 
l'indiquer,  car  on  se  refuse  à  croire  que  dans  une  multitude 
d'épreuves,  on  atteigne  toujours  le  même  résultat,  c'est- 
à-dire  que  l'écart  soit  permanent,  d'une  fixité  complète. 
Chacun  s'attend,  au  contraire,  à  ce  que  les  écarts  soient 
différents,  mais  on  pourrait  croire  qu'ils  se  présentent  en 
désordre.  Pour  vérifier  cette  supposition,  l'expérience  peut 


(1)  Carvallo  :  Le  calcul  des  probabilités  et  ses  applications,  Paris, 
Gauthier-Villars,  1912,  p.  8. 
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suffire.  Quetelet  a  eu  la  patience  de  procéder  à  cette  ex- 
périence. Vingt  boules  blanches  et  vingt  boules  noires  ayant 
été  placées  dans  une  urne,  Quetelet  procéda  à  une  série  de 
tirages,  la  boule  tirée  étant  chaque  fois  remise  dans  l'urne, 
de  manière  que  toutes  les  circonstances  de  l'expérience  res- 
tassent les  mêmes.  Les  résultat»  des  tirages  sont  résumés 
dans  le  tableau  suivant  : 


NOMBRE 
DB 

BOULES  TIRÉES 

DEGRÉ 
DE  PRÉCISION 

NOMBRE   DE  BOULES 

blanches       |  noires 

RAPPORT  DES 

NOMBRES 
PRÉCÉDENTS 

4 

O 

1 

3 

0.33 

16 

4 

8 

8 

1.00 

64 

8 

28 

36 

0.78 

256 

16 

125 

131 

0.95 

1024 

32 

528 

496 

1.06 

4096 

64 

2066 

2030 

1.02 

Les  chances  étant  égales,  le  nombre  de  boules  tirées  de- 
vrait être  égal  de  part  et  d'autre,  mais  il  n'en  a  été  ainsi 
qu'une  seule  fois  et  cet  accord  peut  être  considéré  comme 
accidentel;  au  contraire,  il  y  a  évidemment  tendance  à  se 
rapprocher  de  l'unité  par  la  multiplication  des  tirages. 
L'expérience  est  intéressante,  mais  on  ne  peut  songer  à 
l'étendre  à  tous  les  domaines,  ni  à  la  prolonger  au  delà  d'un 
certain  nombre  :  au  sixième  tirage,  Quetelet  a  déjà  dû 
perdre  beaucoup  de  temps  à  retirer  4,096  fois  une  boule 
hors  de  l'urne  et  à  la  compter  du  côté  des  blanches  ou  des 
noires.  A  la  septième  épreuve,  il  aurait  pu  retirer  16,384 
boules,  à  la  huitième  65,536,  à  la  neuvième  262,144  et  à  la 
dixième  1,048,576,  ce  qui  met  déjà  l'expérience  prolongée  au 
rang  des  impossibilités. 

Il  ne  faut  donc  pas  s'attendre  à  jeter  quelque  lumière  sur 
la  question  au  moyen  de  l'expérience  :  celle-ci  ne  peut  ser- 
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vir  qu'à  indiquer  la  voie,  mais  la  solution  appartient  à  la 
théorie.  Celle-ci  a  été  résumée  en  une  formule  célèbre  con- 
nue sous  le  nom  de  théorème  de  Jacques  Bernouilli  :  étant 
donné  un  nombre  e  aussi  petit  que  l'on  veut,  la  probabilité 
pour  que  la  différence  entre  le  rapport  observé  du  nombre 
des  événements  favorables  et  le  nombre  des  événements 

contraires,  d'une  part,  et  le  rapport  théorique^,  d'autre 

part,  soit  supérieure  en  valeur  absolue  à  e  ,  tend  vers  zéro 
lorsque  le  nombre  n  des  épreuves  augmente  indéfiniment. 

L'exposé  du  théorème  est  reproduit  ici  d'après  Borel  (1)  ; 
on  en  trouvera  un  exposé  plus  complet  dans  Cournot  (2), 
mais  l'énoncé  raccourci  qui  vient  d'être  donné  suffit  à  faire 
apparaître  les  caractères  essentiels  de  la  proposition  : 

1°  Si  le  rapport  des  événements  A  aux  événements  B  est 
égal  à  la  probabilité  théorique,  cette  répartition  est  la  plus 
probable  qui  puisse  se  réaliser;  si  le  rapport  s'éloigne  de 
cette  probabilité,  la  série  affectée  par  ce  rapport  offre  une 
répartition  d'autant  moins  probable  que  la  différence  con- 
statée est  grande. 

2°  Si  le  nombre  des  épreuves  augmente  beaucoup,  la  pro- 
babilité pour  que  la  différence  entre  le  rapport  observé  et  le 
rapport  théqrique  soit  supérieur  à  un  nombre  e  supposé 
aussi  petit  que  l'on  veut,  tend  vers  zéro  (3). 


(1)  Borel  :  Eléments  de  la  théorie  des  prohabilités,  Paris,  Hermann, 
1919,  p.  (54. 

(2)  Cotjrnot  :  Exposition,  de  la  théorie  des  chances,  p.  54.  M.  Mansion. 
loc.  cit.,  p.  46,  donne  cet  énoncé  abrégé  du  théorème  de  Jacques  Bernouilli  : 
«  Soient  deux  événements  contraires  A  et  B,  de  probabilités  p  et  q,  soumis 
à  m  épreuves  répétées  dans  les  mêtmes  circonstances,  c'est-à-dire  que  l'on 
suppose  p  et  q  constants,  m  le  nombre  de  répétitions  de  l'événement  A  : 

[  Pour  u  suffisamment  grand,  on  a,  presque  certainement,  m  :  =  à  peu 
près  p.] 

Cfr.  la  brillante  démonstration  complète  du  théorème  de  Bernouilli  donnée 
par  M.  Mansion,  loc.  cit.,  pp.  47  à  58. 

(3)  DE  Montessub  :  Leçons  élémentaires  sur  le  calcul  des  probabilités, 
Taris.  Gauthier- Villars,  1910. 
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404.  La  démonstration  du  théorème  de  Bernouilli  appar- 
tient au  calcul  des  probabilités;  le  statisticien  n'a  qu'à  se 
référer  aux  traités  sur  la  matière,  il  en  existe  d'excellents 
et  parmi  les  plus  récents  parus,  en  langue  française  il  en  est 
dont  les  auteurs  ont  fait  un  louable  effort  pour  se  mettre 
à  la  portée  des  personnes  non  familières  avec  les  mathéma- 
tiques supérieures  ou  qui  n'en  font  pas  un  usage  habituel. 

Le  lecteur  voudra  bien  consulter  ces  ouvrages  s'il  désire 
trouver  la  démonstration  du  fameux  théorème  de  Ber- 
nouilli. Sans  empiéter  sur  un  domaine  qui  n'est  pas  le 
nôtre,  nous  voudrions  cependant  donner  au  lecteur  une  cer- 
taine idée  du  maniement  de  la  formule  qu'il  faut  employer 
pour  déterminer  les  éléments  numériques  de  la  probabilité. 
Nous  avons  déjà  dit  que  ces  calculs  étaient  excessivement 
longs. 

Supposons  qu'on  ait,  parmi  100  objets  donnés  à  choisir 
de  toutes  les  façons  imaginables,  d'une  part  40  et  d'autre 
part  60  objets.  Nous  sommes-  dans  la  règle  des  combinaisons 
et  nous  pouvons  écrire  comme  première  expression  destinée 
à  calculer  le  nombre  de  cas  qui  feront  apparaître  l'événe- 
ment souhaité  40  fois  sur  100  : 

Woo  —  P     VI'  (  > 

Voulons-nous  savoir  en  combien  de  cas  l 'événement  appa- 
raîtra 41  fois,  nous  aurons,  en  modifiant  en  conséquence  la 
formule  précédente  : 

ç4i  PI00 


100     P41  x  P59 


et  pour  épuiser  la  série,  il  nous  faudra  aller  jusqu'à  l'inver- 
sion des  termes  P4o  et  F'co-  L'exemple  précédent  est  basé 
sur  une  alternative,  comme  au  jeu  de  pile  ou  face,  de  sorte 
-que  le  dénominateur  de  la  fraction  est  représenté  par  2, 


oo 
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cl  le  numérateur  par  la  somme  de  toutes  les  combinaisons 
possibles-  depuis  40  jusqu'à  60  (1)  : 


40     ,     «41  „00 


,,40  Cioo  +  Cioo  +••••+  C<00  ,g3) 
r>0  21  OU 

Même  pour  un  exemple  simple  qui  ne  comprend  que  les 
100  premiers  nombres,  le  calcul  des  expressions  ci -dessus 
comporte  un  travail  énorme,  capable  de  faire  reculer  le  cal- 
culateur le  plus  intrépide.  Il  ne  faut  même  pas  compter  sur 
le  secours  des  machines  à  calculer,  parce  que  la  grandeur 
des  nombres  dépasse  rapidement  la  capacité  d'enregistre- 
ment de  ces  appareils;  et  l'aide  des  tables  de  calcul  n'est 
non  plus  que  d'une  médiocre  utilité  à  cause  que  les  nombres 
deviennent  en  peu  de  temps  trop  considérables  ;  il  y  a  bien 
les  procédés  de  décomposition  des  nombres,  mais  ces  mé- 
thodes compliquées  et  longues  ne  peuvent  réellement  ren- 
dre pratiques  des  calculs  aussi  étendus. 

405.  Il  importait  de  trouver  une  simplification  de  ces 
expressions,  sinon  le  calcul  des  probabilités,  sans  applica- 
tion possible,  fût  resté  à  l'état  de  simple  curiosité.  La  for- 
mule simplificative  est  due  à  Stirling,  mathématicien  écos- 
sais (1692-1770);  elle  a  pour  but  de  faire  connaître,  d'une 
manière  approximative,  le  produit  des  n  premiers  nom- 
bres entiers,  quel  que  soit  le  nombre  en  question. 

La  formule  de  Stirling  peut  s'écrire  de  la  sorte  (2)  : 


ni  =  nne-n  v/2ttw  (1  +  en) 

on  d'une  manière  plus  simple  et  en  désignant  le  nombre 
obtenu  par  Sw  (S  étant  l'initiale  de  Stirling)  (3)  : 


Sn 


-i  S/Znn  (85) 


(1)  Ces  expressions  sont  empruntées  à  M.  Carvallo,  op.  cit.,  pp.  14-15  dont 
nous  suivons  plus  d'une  fois  le  remarquable  exposé. 

(2)  Borel,  op.   cit.,  p.  39. 

(3)  Caiivallo,  op.  cit.,  p.  16.  (Valeur  approchée  seulement  tant  que 
n  est  fini .  ) 

41 
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Dans  la  première  formule,  dont  la  démonstration  revient 
aux  ouvrages  d'analyse,  n  est  un  nombre  entier  aussi  grand 
que  de  besoin,  e  est  la  base  des  logarithmes  népériens 
(2,71828...), tt  est  le  rapport  bien  connu  de  la  circonférence 
au  diamètre,  ( tt  =  3.14159...)'  et  ew  un  nombre  variable 
avec  n,  mais  qui  tend  vers  zéro  lorsque  n  augmente  indéfi- 
niment (1). 

Ces  mêmes  éléments  définissent  tous  les  termes  de  la  se- 
conde formule. 

La  formule  de  Stirling  est  une  formule  d'approximation 
grossière.  La  différence  entre  le  nombre  n!  donné  par  la 
formule  de  Stirling  et  le  résultat  exact  qui  serait  atteint 
par  le  calcul  patient  des  combinaisons  et  la  mise  en  formule 
de  leur  résultat,  apparaît  énorme  et  elle  est  d'autant  plus 
grande  que  le  nombre  d'épreuves  est  grand.  Mais,  par  con- 
tre, l'erreur  relative  sera  extrêmement  petite,  d'autant  plus 
petite  que  le  nombre  absolu  sera  grand;  cette  erreur  rela- 
tive est  la  seule  qui  nous  importe,  et  comme  la  probabilité 
serait  suffisamment  connue  à  un  centième  près,  la  formule 
de  Stirling  qui  nous  assure  d'un  degré  de  précision  bien 
supérieur  et  tendant  vers  zéro,  répond  à  toutes  les  exigences 
possibles. 

Pour  mettre  en  nombre  la  formule  de  Stirling,  il  faut 
remplacer  n  par  le  nombre  auquel  on  s'arrête,  e  et  tt  par 
leurs  valeurs  indiquées  plus  haut.  Le  calcul  se  fait  par  loga- 


(1)  Stirling  a  publié  sa  formule  en  1730,  mais  elle  n'a  été  établie  avec 
rigueur  qu'au  xixe  siècle.  La  démonstration  en  a  été  faite  par  Tehebichef, 
en  1846,  et  elle  a  été  développée  par  Eouché  en  1890.  M.  Mansion  l'a  géné- 
ralisée en  1908  et  1911;  notre  savant  compatriote,  dans  la  note  TI  annexée 
au  «  Cours  de  calcul  des  probabilités  »  de  E.-J.  Boudin,  a  montré  comment 
on  peut  exposer  la  théorie  de  Tehebichef  d'une  manière  entièrement  élémen- 
taire . 

(Cfr.  Emmanuel-Joseph  Boudin  Leçons  de  calcul  des  probabilités  faites 
à  l'Université  de  Gand  de  1846  à  1890,  publiées  avec  des  notes  et  des  addi- 
tions par  Paul  Mansion,  professeur  à  l'Université  de  Gand,  membre  de 
l'Académie  Royale  de  Belgique.  Paris,  Gauthier-Villars,  1916,  note  II  (for- 
mule de  Stirling),  p.  244.) 
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rithmes.  La  partie  entière  du  logarithme  Sw  indique  le 
nombre  de  chiffres,  auquel  il  faut  ajouter  1,  dont  s<;  com- 
pose le  nombre  cherché;  en  remontant  du  logarithme  au 
nombre,  par  les  tables,  on  trouve  l'expression  approchée, 
dont  l'erreur  est  d'autant  plus  petite  que  le  nombre  exact 
est  élevé  (1). 

406.  L'application  de  la  formule  de  Stirling  comporte  la 
multiplication  par  2  du  nombre  limite,  celui  auquel  on  dé- 
sire s'arrêter  ([/'in  »).  Dans  le  calcul  de  Pw,  on  arrive  à  une 
expression  qui,  par  suite  des  simplifications  entre  le  numé- 
rateur et  le  dénominateur,  se  réduit  à  |  /       Cette  constante 

TT 

a  pour  nombre  0.797816  et  son  logarithme  est  9.9019401; 
le  nombre  0.797816  multiplié  par  le  nombre  de  termes 
plus  1,  compris  dans  l'expression  fractionnaire  exprimant 
la  probabilité,  nombre  lui-même  divisé  par  100,  donne  la 
valeur  de  la  probabilité  cherchée.  La  probabilité  de  l'écart 
de  devenir  de  plus  en  plus  faible  est  corrélative  de  la  pro- 
babilité de  séries  de  plus  en  plus  longues  ;  ces  probabilités 
qui  diffèrent  de  moins  en  moins  et  se  rapprochent  toujours 

davantage  de  la  limite        £  peuvent  être  calculées  aisément 

à  l'aide  d'une  formule  tirée  du  théorème  de  Bernouilli,  for- 
mule qui  elle-même  est  remplacée  par  une  seule  table  numé- 
rique qui,  une  fois  calculée,  peut  trouver  son  application 
dans  tous  les  cas. 

Voici  cette  table  telle  qu'elle  est  reproduite  par  M.  Car- 
vallo  d'après  Houël  (Recueil  de  formules  et  de  tables  numé- 
riques), à  la  fin  de  son  ouvrage  sur  le  calcul  des  probabi- 
lités. 


(1)  On  trouvera  dans  Carvaixo,  p.  17,  un  exemple  complet  de  la  mise  en 
nombre  de  la  formule  de  Stirling. 


644 


PRINCIPES    DE  STATISTIQUE 


TABLE  DES  PROBABILITÉS  DES  ÉCAKTS  d'aPKÈS  LA   FORMULE  REDUITE  : 


2     I  t 

p  = Zr\  e~ 


t 

o  1 

1 

2 

3 

4 

5 

6 

7 

« 

9 

d 

0.0 

0  0000 

01  13 

0226 

0338 

0451 

0564 

(1676 

0789 

0901 

1013 

112 

1 

1125 

1-236 

1348 

1459 

1569 

1680 

1790 

1900 

2009 

2118 

109 

2 

2227 

2-35 

2443 

2550 

2657 

2763 

•2869 

2974 

3079 

3183 

103 

3 

3286 

3389 

3491 

3593 

3694 

3794 

3893 

3992 

4090 

4187 

97 

4 

4284 

4380 

4475 

4569 

4662 

4755 

4847 

4937 

5028 

5117 

88 

0.5 

0  5205 

5292 

5379 

5465 

5549 

5633 

5716 

5798 

5879 

5959 

80 

6 

6039 

«117 

6194 

627d 

6346 

6420 

6-194 

6566 

6638 

6708 

70 

7 

6778 

6847 

6914 

6981 

7047 

7112 

7175 

7238 

7300 

7361 

60 

8 

7421 

7480 

7538 

7595 

7651 

7707 

7761 

7814 

7867 

7918 

51 

9 

7969 

8019 

8068 

8116 

8163 

8209 

8254 

8299 

8342 

8385 

42 

1.0 

0.8427 

8468 

850* 

8548 

8586 

8624 

8661 

8698 

8733 

8768 

34 

1 

8802 

8835 

8868 

8900 

8931 

8961 

8991 

9020 

9048 

9076 

27 

2 

9103 

9130 

9155 

9181 

9205 

9229 

9252 

9275 

9297 

9319 

21 

3 

9340 

9361 

9381 

9,00 

9419 

9438 

9456 

9473 

9490 

9507 

16 

4 

9523 

9539 

9554 

9569 

9583 

9"97 

9611 

9624 

9637 

9649 

12 

1.5 

0.9661 

9673 

9684 

9695 

9706 

9716 

9726 

9736 

9745 

9755 

8 

6 

9763 

9772 

9780 

9788 

9706 

9804 

9811 

9818 

9825 

9832 

6 

7 

9838 

9844 

9850 

9856 

9861 

9867 

9872 

9877 

9882 

9886 

5 

8 

9891 

9895 

9^99 

9903 

9907 

9911 

9915 

9918 

9922 

9925 

3 

9 

9928 

9931 

9934 

9937 

9939 

9942 

9944 

9947 

9949 

9951 

2 

2.0 

0.9953 

9970 

9981 

9989 

9993 

9996 

9998 

9999 

9999 

0000 

Ainsi,  d'après  cette  table,  pour  connaître  la  probabilité 
que  l'écart  réduit  ne  dépasse  pas  un  certain  nombre,  on 
commence  par  chercher  le  premier  chiffre  de  ce  nombre 


(1)  Les  Allemands,  dit  M.  Mansion,  loc .  cit.,  note  III,  p.  251,  nomment 
l'intégrale  J  intégrale  de  Gauss,  mais  Gauss  lui-même  l'appelle  toujours 
intégrale  de  Laplaec .  L'illustre  mathématicien  français  l'a  en  effet  étudiée 
dès  1778.  dans  un  Mémoire  sur  les,  probabilités  publié  en  1781  par  l'Académie 
des  Sciences  de  Paris. 
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dans  la  première  colonne,  puis  on  cherche  le  second  chiffre 
dans  une  des  colonnes  numérotées  de  0  à  (J  et  on  s'arrête  en 
face  de  la  ligne  occupée  par  le  premier  chiffre  :  le  nombre 
écrit  dans  la  seconde  colonne  à  cet  endroit  est  la  probabilité 
que  l'on  cherche  (1). 

La  table  des  écarts  réduits  peut  se  traduire  graphique- 
ment. Il  suffit  de  porter  sur  l'axe  des  abeisses  l'échelle  de 
l'écart  réduit  t  et  sur  l'axe  des  ordonnées  les  divisions  de 
l'unité  de  0  à  1,  en  donnant  une  importance  égale  aux  divi- 
sions portées  sur  chacun  des  deux  axes.  Ainsi  le  point  0.1 
des  ordonnées  correspondant  au  point  0.1  des  abeisses  a 
pour  valeur  0.1236;  on  peut  indifféremment  construire  le 
graphique  à  l'aide  de  la  table  ou  remonter  du  graphique  à 
la  table  numérique.  L'utilisation  de  la  table  suppose  l'ap- 
plication de  la  règle  de  l'écart-étalon;  on  la  formule  ainsi  : 
l'écart-étalon  est  celui  qui  correspond  au  nombre  1  de  la 
table  de  Bernouilli  et  au  nombre  1  du  graphique  procédant 
de  la  table;  la  probabilité  d'avoir  un  écart  inférieur  à 
l'écart-étalon  est  0.84.  La  formule  du  calcul  pour  cet  écart 
est 


Ensuite,  si  l'on  veut  connaître  la  probabilité  que  l'écart 
ne  dépasse  pas  un  nombre  donné  x,  on  divisera  l'écart 
donné  par  l'écart-étalon.  Le  quotient  correspond  à  l'écart 
réduit  t  que  l'on  trouve  en  tête  de  la  première  colonne  de  la 
table  et  ce  calcul  permet  enfin  l 'utilisation  de  celle-ci. 

407.  Jusqu'à  présent,  nous  nous  sommes  efforcé  de  con- 
denser en  quelques  pages  les  considérations  d'ordre  mathé- 
matique qui  sont  le  commentaire  nécessaire  du  théorème 


(1)  On  trouvera  une  table  plus  détaillée  dans  l'ouvrage  de  M  de  Mon- 
tessus  :  Leçons  élémentaires  sur  le  calcul  des  probabilités,  p.  44  et  une 
table  très  réduite  dans  Borel  :  Eléments  de  la  théorie  des  probabilités, 
p.  54. 


(86) 
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de  Bernouilli  et  les  tables  graphique  et  numérique  qui  en 
sont  la  traduction.  Il  nous  reste  à  montrer  comment  ce  hors 
d 'œuvre  a  son  utilité  à  l'égard  des  statistiques. 

Le  théorème  de  Bernouilli  définit  les  conditions  du  ha- 
sard; or,  la  statistique,  par  ses  vérifications  a  posteriori, 
permet  d'établir  la  loi  des  phénomènes  qu'elle  étudie;  cette 
loi  est-elle  conforme  à  la  loi  du  hasard?  La  vérification  de 
ce  point  est  d'un  puissant  intérêt,  elle  nous  conduit  à  une 
classification  des  faits  conforme  à  une  notion  essentielle- 
ment scientifique.  Pour  cette  vérification,  on  fera  la 
moyenne  des  données  (mesures,  nombres)  de  la  statistique 
et  l'on  calculera  les  écarts  de  chaque  donnée  à  cette 
moyenne;  si  les  écarts  classés  par  grandeur  se  groupent 
d'une  façon  sensiblement  analogue  à  la  courbe  dérivée  de  la 
formule  de  Bernouilli,  l'assimilation  du  phénomène  avec 
les  données  résultant  du  hasard  est  permise. 

Les  mathématiciens  se  sont  montrés  parfois  très  durs  à 
l'égard  de  la  statistique  et  des  statisticiens.  Habitués  à 
raisonner  sur  des  formules  rigides,  ils  ne  peuvent  tolérer 
ce  qu'il  peut  y  avoir  d'imprécis  dans  certains  résultats  sta- 
tistiques qui  sont  plus  des  approximations  qu'une  véri- 
table détermination  de  la  vérité.  Les  sciences  de  pur  rai- 
sonnement ont  cet  avantage  sur  les  sciences  d'observation 
qu'elles  ne  dépendent  presque  pas  des  contingences;  au 
contraire  toute  observation  se  heurte  à  de  multiples  diffi- 
cultés :  erreurs  des  instruments;  maladresse  de  l'observa- 
teur; nécessité  de  recourir,  comme  dans  les  statistiques,  à 
de  très  nombreux  collaborateurs  dont  le  zèle,  l'intelligence 
et  la  probité  scientifique  ne  peuvent  être  garantis  d'une 
manière  absolue  ;  manque  de  sincérité  des  personnes  inter- 
rogées; moyens  financiers  et  matériels  insuffisants... 

Par  le  fait  même,  les  sciences  de  raisonnement  peuvent 
présenter  des  résultats  plus  précis,  plus  exacts  que  les 
autres  disciplines  qui  s'appuient  sur  des  observations;  non 
contents  de  cet  avantage,  les  mathématiciens  ou  certains 
d'entre  eux  ont  voulu  identifier  la  valeur  d'une  statistique 
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quelconque  avec  sa  conformité  à  la  loi  du  hasard.  Nous  pen- 
sons que  c'est  une  erreur  et  qu'il  convient  de  se  montrer 
plus  large  et  plus  précis  à  la  fois;  certains  résultats  sta- 
tistiques sont  gouvernés  par  la  loi  du  hasard,  c'est  incon- 
testable, et  à  ceux-là  le  théorème  de  Bernouilli  est  entière- 
ment applicable,  mais  à  côté  de  ces  cas  spéciaux,  il  est  une 
multitude  de  résultats  provenant  d'une  observation  scien- 
tifique de  Valeur,  qui  ne  sont  pas  soumis  à  la  loi  dont  il 
s'agit.  La  statistique  peut  être  bien  faite  et  n'avoir  rien  de 
commun  avec  la  répartition  des  chances  résumée  dans  la 
table  de  Bernouilli.  La  démonstration  la  plus  évidente  de 
cette  vérité  se  trouve  dans  l'exemple  de  statistiques  judi- 
ciaires :  peut-on  ou  ne  peut-on  pas  déterminer  la  probabilité 
qu  'un  innocent  a  d 'être  condamné  en  justice  1  Cette  question, 
encore  qu'elle  paraisse  étrange  à  première  vue,  a  intéressé 
un  grand  nombre  de  mathématiciens,  et  non  des  moindres  : 
Condorcet,  Laplace,  Poisson,  Cournot...  Chacun  d'eux  a 
proposé  sa  solution  :  sans  descendre  à  l'analyse  mathéma- 
tique de  leurs  formules,  on  peut  nier  l'exactitude  de  celles- 
ci  parce  que  la  probabilité  d'un  jugement  équitable  n'est 
pas  et  ne  peut  pas  être  connue.  Ce  n'est  que  par  des  so- 
phismes  de  raisonnement  et  de  calcul  qu'on  est  parvenu  à 
donner  une  valeur  à  cette  probabilité  (1)  ;  toujours  il  a  fallu 
admettre  une  proposition  non  démontrée;  Condorcet  assi- 


(1)  M.  Mansion,  après  avoir  cité  les  paroles  de  Bertrand  «  on  peut  peser 
le  cuivre  et  le  donner  pour  or,  la  balance  est  sans  reproche  »,  paroles  qui 
répondaient  au  mot  célèbre  de  Stuart  Mill  (l'application  du  calcul  des  proba 
bilités  aux  décisions  judiciaires  est  le  scandale  des  mathématiques)  ajoute 
que  cet  argument  de  Bertrand  excuse  les  mathématiques  mais  n'excuse  pas 
les  mathématiciens  d'avoir  tenté  de  soumettre  au  calcul  des  prohabilités 
des  événements  qu'il  est  évidemment  impossible  de  ranger  sous  une  loi, 
si  peu  strictement  approximative  qu'on  la  suppose.  Au  moins  avons-nous 
cette  consolation,  continue  M.  Mansion,  que  c'est  un  mathématicien  aussi, 
Bertrand  lui-même  qui  a  définitivement  banni  des  traités  ce  chapitre  humi- 
liant sur  la  probabilité  des  jugements. 

Ofr.  Mansion,  loc.  cit.  Note  XIII,  p.  314. 
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milait  les  jugements  équitables  à  des  boules  blanches  tirées 
d'une  urne  contenant,  à  côté  de  boules  noires,  une  certaine 
proportion  de  boules  blanches.  Mais  quelle  proportion? 

Si  le  nombre  de  boules  blanches  est  plus  grand  que  celui 
des  boules  noires,  il  doit  y  avoir  pour  l'innocent  plus  de 
chances  de  voir  résoudre  son  cas  par  un  jugement  favo- 
rable que  d'être  condamné,  et  cette  chance  augmente  à  me- 
sure que  le  nombre  de  tirages  est  plus  considérable  :  aussi 
un  innocent  aurait-il,  dans  cette  hypothèse,  tout  avantage  à 
faire  prononcer  sur  son  procès  tous-  les  juges  du  pays.  Le 
cas  inverse  se  présenterait  si  la  composition  de  l 'urne  était 
dans  le  sens  contraire. 

On  a  aussi  imaginé  d'obtenir  la  valeur  de  la  probabilité 
en  se  basant  sur  le  nombre  de  jugements  réformés.  Ce  sys- 
tème pèche  contre  la  logique,  car  rien  ne  nous  dit  que  les 
juges  d'appel  auront  une  appréciation  plus  juste  que  celle 
des  magistrats  de  première  instance;  puis  il  y  a  des  déci- 
sions judiciaires  réformées-  pour  simple  vice  de  forme,  et 
celles  dont  l'accusé,  pour  un  motif  quelconque,  et  qui  n'est 
pas  toujours  un  aveu,  n'interjette  pas  appel;  bref,  il  faut 
renoncer  à  rechercher  une  probabilité  qui  ne  peut  pas  être 
définie  (1). 

L'exemple  ci-dessus  prouve  qu'il  ne  suffit  pas  qu'une  sta- 
tistique soit  aussi  bien  faite  qu'on  le  désire  pour  que  le 
théorème  de  Bernouilli  lui  soit  applicable. 

408.  Après  ces  considérations  d'ordre  général,  appro- 
chons de  plus  près  le  terrain  d'application  du  théorème  de 
Bernouilli  aux  faits  statistiques  et  demandons-nous  quels 


(1)  M.  Mansion,  loc.  cit.  cite  ces  paroles  de  Bertrand  :  «  L'indépendance 
des  tirages  (dans  le  cas  du  tirage  de  boules  d'une  urne  qui  en  contient  des 
blanches  et  des  noires)  est  supposée;  les  urnes,  dans  les  calculs,  échappent 
à  toute  influence  commune.  Les  juges,  au  contraire,  s'éclairent  les  uns 
les  autres;  les  mêmes  faits  les  instruisent,  les  mêmes  témoignages  les 
troublent,  la  même  éloquence  les  égare,  c'est  sur  les  mêmes  considérants 
qu'ils  font  reposer  la  vérité  ou  l'erreur.  L'assimilation  est  impossible.  » 
(Bertrand,  p.  XIV.) 
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sont  les  problèmes  auxquels  ce  théorème  réserve  une  solu- 
tion. Nous  avons  vu  plus  haut  que  parmi  les  desiderata 
principaux  de  la  science,  on  pouvait  faire  figurer  la  com- 
paraison des  résultats  de  l'expérience  avec  les  données  de 
la  théorie.  Ainsi,  il  est  important  en  statistique  de  compa- 
rer la  distribution  des  écarts  annuels  d'un  phénomène  à  la 
distribution  théorique  des  écarts  accidentels.  Ce  problème 
avait  été  proposé  en  France  à  un  concours  pour  le  recrute- 
ment de  statisticiens  officiels  en  appliquant  les  données  à 
la  proportion  observée  de  naissances  masculines,  sachant 
que  la  moyenne  de  26  années  couvertes  par  l'observation 
est  pour  les 

Nés  vivants  378,241  garçons  356,208  filles  734,449  total 
Mort-nés         10,319  garçons       7,637  filles     17,956  total 

Cet  exemple  a  été  choisi  par  M.  Carvallo  pour  exposer 
la  méthode  à  suivre  dans  l'étude  de  la  comparaison  entre 
les  écarts  observés  et  les  écarts  théoriques.  Nous  suivrons 
ici  les  explications  de  M.  Carvallo,  en  les  abrégeant  le  plus 
souvent  et  en  les  développant  dans  d'autres  cas  (1). 

Nous  commençons  par  admettre  que  tout  le  matériel  sta- 
tistique est  réuni  et  que  pour  chacune  des  26  années  sur  les- 
quelles portent  les  observations  on  connaisse  le  nombre 
d'enfants  nés  vivants  ou  mort-nés,  garçons  et  filles.  Le  cal- 
cul de  la  moyenne  générale  se  fait  d'après  la  règle  de  la 
moyenne  arithmétique  simple,  méthode  directe,  dont  nous 
rappelons  la  formule  : 

M'=|s(X)  (10) 

Cette  moyenne  générale  étant  connue,  il  y  a  lieu  ensuite 
de  calculer  les  écarts  de  chaque  donnée  annuelle  à  la 
moyenne  d'ensemble.  On  étudie  ces  écarts  en  calculant  tout 
d'abord  la  fréquence  de  l'apparition  du  phénomène  pour 


(1)  Carvallo  :  Le  calcul  des  probabilités  et  ses  applications  Paris, 
Gauthier-Villars,  1912,  pp.  41-62. 
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chaque  année  et  pour  la  moyenne  formée  de  l'ensemble. 
L'unité  marquant  la  certitude,  la  probabilité  a  posteriori  p 
s'exprimera  par  une  fraction  décimale;  celle-ci  sera  com- 
parée à  la  moyenne  et  l'écart,  selon  qu'il  sera  positif  ou  né- 
gatif, sera  précédé  du  signe  -|-  ou  du  signe  — .  L 'écart  avec 
la  moyenne  est  parfois  très  faible,  parfois  nul. 

Dans  l'exemple  donné  l'écart  le  plus  considérable  est  de 
18  unités  de  l'ordre  du  dix-millième;  c'est  un  écart  négatif 
qui  s 'est  produit  la  22e  année  ;  par  contre,  il  y  a  trois  années 
où  il  y  a  coïncidence  absolue  entre  la  probabilité  théorique 
et  la  probabilité  a  posteriori. 

Le  classement  des  écarts  par  ordre  de  grandeur  est  en- 
suite à  effectuer.  Le  chiffre  de  18  unités  de  l'ordre  du  dix- 
millième  comme  écart  maximum  suggère  immédiatement  le 
chiffre  de  deux  unités  du  même  ordre  pour  classer  les  écarts 
d'après  leur  grandeur;  on  pourrait  aussi  prendre  le  chiffre 
de  trois  unités,  mais  ce  choix  aurait  pour  conséquence  de 
réduire  le  nombre  de  classes  à  6  au  lieu  de  9,  ce  qui  serait  de 
nature  à  rendre  plus  confuse  l'étude  complète  du  phéno- 
mène. Il  est  donc  formé  un  tableau  comprenant  9  divisions 
de  2  en  2  dix-millièmes  ;  en  regard  de  la  première  colonne 
réservée  à  ces  divisions  (2,  4,  6,  8,  ...  18)  l'étudiant  inscrira 
le  nombre  d'écarts  qui  restent  dans  la  limite  indiquée,  c'est- 
à-dire  qui  ne  sont  pas  supérieurs  à  2  dix-millièmes,  etc.  ;  on 
fera  attention  à  deux  choses  :  c'est  que  les  données  indi- 
quant un  écart  zéro  doivent  entrer  en  ligne  de  compte  et 
qu'à  la  deuxième  division  (4)  on  compte  non  seulement  les 
écarts  compris  entre  2, 1  et  4,  mais  aussi  ceux  faisant  partie 
de  la  première  division  0  à  2.  Le  nombre  de  ces  écarts  est 
appelé  nombre  de  distribution  correspondant  à  l'écart  X  et 
est  désigné  par  la  lettre  O  (X).  Les  nombres  ainsi  obtenus 
sont  inscrits  en  regard  de  chaque  division  et  forment  la 
seconde  colonne  du  tableau.  Une  troisième  colonne  est  ob- 
tenue en  y  portant  la  différence  entre  le  1er  et  le  T  chiffre 
de  la  seconde  colonne,  entre  le  2e  et  le  3e  et  ainsi  de  suite; 
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cette  colonne,  dans  le  cas  pris  pour  exemple,  compte  H  divi- 
sions, c'est-à-dire  une  de  moins,  comme  il  est  naturel,  que 
les  deux  colonnes  précédentes. 

409.  Cette  phase  des  opérations  peut  être  considérée 
comme  la  phase  préparatoire  ;  elle  met  le  matériel  en  état 
d'être  utilisé  dans  le  but  qu'on  se  propose.  Il  faut  mainte- 
nant étudier  la  question  de  savoir  quelle  serait  la  distribu- 
tion théorique  des  écarts,  si  l'on  admet  que  l'apparition  du 
phénomène  est  réglée  comme  si  elle  était  assimilable  à  la 
sortie  d'une  boule  blanche  ou  noire  d'une  urne  dont  la  com- 
position resterait  constante,  la  probabilité  de  la  naissance 
d'un  garçon  étant  celle  indiquée  comme  probabilité  a  pos- 
teriori; à  savoir  :  0.5150.  Déterminons  tout  d'abord  la  posi- 
tion qui  correspond  à  la  longueur  1  de  l'échelle  de  la  courbe 
ou  au  nombre  1  de  la  table  de  Bernouilli,  sachant  que  la  pro- 
babilité de  l'événement  est  0.5150  et  que  le  nombre  des 
épreuves,  autrement  dit  le  nombre  total  de  naissances,  est 
734,449.  La  valeur  que  nous  cherchons  est  celle  de  l'écart- 
étalon  dont  la  formule  est  : 


1/ 


(86) 


or, 


1  — jo  =  1  —  0.5150  =  0.4850 

0  —  P)  =  2  X  0.5150  x  0.4850  =  0.49955. 
2p(l— jrt  0.49955 


0.00000068017 
734449 


-  l/?-p4 


-p)  _ 


0.000824  (1) 


Calculons  ensuite  la  valeur  réduite  t,  à  l'aide  de  laquelle 
on  peut  utiliser  la  table  de  Bernouilli.  En  regard  de  t  se 


(1)  Et  non  0.000816.  valeur  calculée  par  M.  Carvallo,  op.  cit.,  p.  44. 
Cette  correction  modifie  les  résultats  subséquents  obtenus  par  M.  Carvallo, 
notamment  le  tableau  de  distribution,  p.   45  du  même  ouvrage. 
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trouve  dans  la  table  le  nombre  P  (t)  exprimant  la  fréquence 
théorique  à  comparer  à  la  fréquence  observée.  Or, 

x  0.0002 

t  =  -:  —   =  0.2427  (1) 

e      0.000824  1  ; 

pour  le  premier  écart,  c'est-à-dire  le  quotient  de  la  division 
de  l'écart  brut  x  par  l'écart-étalon. 

Par  écart  brut,  nous  entendons  le  chiffre  qui  exprime  les 
grandeurs  des  écarts  rangés  par  classe.  Pour  le  second  cas 
de  la  série 

0.0004 

t  =    =  0.4854 

0.00(1824 

Les  nombres  de  distribution  0  (x)  doivent  être  divisés 
par  le  nombre  des  années  observées  (N).  Ce  résultat  a  pour 
symbole  cp  (t)  fréquences  qui  correspondent  aux  valeurs 
échelonnées  de  t. 

410.  L'ensemble  de  ces  données  compose  le  tableau  de 
distribution,  à  propos  duquel  il  y  a  lieu  de  rappeler  les  va- 
leurs et  formules  suivantes  : 

n  =  734449  e  =  0.000824 

*t  x         .  0.0002 

N  =  26  t  =  -  (premier  cas  =  — — — -  =  0.2427 

e  F  0.000824 

0  (x)  I  8  v 

p  =  0.5150  q>f.  =  —^-'  premier  cas  =  —  =  0,3077  ou  0,308 

N   \  26  / 


(1)  Et  non  0,245,  correction  qui  est  la  conséquence  de  la  remarque  faite  à 
la  note  de.  la  page  précédente. 
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ANNÉES 

Fréquence 

des 

naissances  masculines 
r  ipportées  à  l'unité 

Écarts  positifs 

Écarts  négatifs 

Écarts 

1 

0.5164 

0.0014 

2 

0.5166 

0.0016 

3 

0.5150 

o 

4 

0.5157 

0.0007 

5 

0.5151 

0.0001 

6 

0.5156 

0.0006 

7 

0.5159 

0.0009 

8 

0.5155 

00.005 

9 

0.5161 

0.0011 

10 

0.5140 

0.0010 

11 

0.5150 

o 

12 

0.5149 

0.0001 

13 

0.5140 

0.0010 

14 

0.5145 

0.0005 

15 

0  5148 

0.0002 

16 

0.5147 

0.0003 

17 

0.5152 

0  0002 

18 

0.5145 

0 . 0005 

19 

0.5138 

0.0012 

20 

0.5144 

0.0006 

O  1 

0.5157 

0.0007 

22 

0.5132 

0.0018 

23 

0.5146 

0.0004 

24 

0.5151 

0.0001 

25 

0.5150 

0 

26 

0.5147 

0.0003 

M  0.5150  (p). 
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Classement  des  Écarts 

X  0  (X)  Différences 
2  8' 

4  11 

6  16 

8  18 

10  21 

12  23 

14  24 

16  25 

18  26 


Distribution  et  Réduction. 


X 

<t>  (x) 

t 

<p(f) 

0.0002 

8 

0.2427 

0.308 

0.0004 

11 

0.4854 

0.423 

0.0006 

16 

0.7281 

0.615 

0.0008 

18 

0.9708 

0.692 

0.0010 

21 

1.2135 

0.808 

0.0012 

23 

1.4563 

0.885 

0.0014 

24 

1.6990 

0.923 

0.0016 

25 

1.9417 

0.962 

0.0018 

26 

2.1844 

1.000 

.  Les 

premiers  calculs 

étant  ainsi 

effectués,  i 

iieu  de  recourir  à  la  comparaison  graphique  entre  la  courbe 
théorique  et  la  courbe  représentative  des  écarts  observés-. 
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Commençons  par  construire  la  courbe  théorique.  Dans  ce 
but,  nous  utilisons  la  table  de  Bernouilli  dont  nous  avons 
reproduit  plus  haut  un  modèle  réduit.  (Cfr.  n "  396.)  Le  lec- 
teur pourra  utiliser  s'il  le  désire,  une  table  plus  détaillée 
s'il  veut  arriver  à  une  approximation  plus  exacte  (1).  Sur 
l'axe  horizontal  des  abcisses  nous  portons,  à  intervalles 
égaux,  les  divisions  correspondantes  aux  nombres  t  de  la 
table,  à  savoir  :  0,0 ;  0,1  ;  0,2 ;  0,3  ;  etc.,  jusqu'au  nombre  4,80 
dont  la  valeur  correspondante  est  0,99999999999,  mais  pra- 
tiquement on  peut  s'arrêter  au  nombre  2  dont  la  valeur 
est  déjà  0,9953223. 

Sur  l'axe  vertical  des  ordonnées,  nous  portons  des  divi- 
sions égales  dont  l'ensemble  constitue  l'échelle  des  proba- 
bilités, allant  de  0,0  à  1,  ce  dernier  chiffre  marquant  la  cer- 
titude. 

En  lisant  la  table,  nous  voyons  que  le  point  0.1  =  0.1125, 
le  point  2  a  pour  valeur  correspondante  0.2227,  le  point  0.9 
sera  représenté  par  la  valeur  0.7969,  etc.  En  réunissant 
tous  ces  points  par  un  trait,  nous  obtenons  la  courbe  théo- 
rique de  probabilité;  elle  est  représentée  sur  le  graphique 
ci-après  par  le  trait  plein.  Nous  avons  maintenant  à  repor- 
ter sur  le  même  graphique  les  fréquences  observées; 
consultons  la  table  de  réduction  (Cfr.  n°  410)  :  nous  y 
trouvons  les  valeurs  de  t  et  de  cp  (t).  Les  valeurs  de  t  se- 
ront portées  sur  l'échelle  des  abcisses  et  les  valeurs  de 
<P  (t)  mesurées  sur  l'axe  des  ordonnées  par  une  verticale 
menée  de  chaque  point  t;  donc  au  point  0.2427  situé  sur 
l'axe  horizontal  correspond  une  valeur  0.308  immédiate- 
ment au-dessus  et  ainsi  de  suite.  Les  points  déterminés  de 
la  sorte  sont  inscrits  sur  le  graphique  au  moyen  d'un  petit 
cercle.  Pour  relier  ces  points  entre  eux,  on  trace  une 
courbe  interpolatrice,  car  la  position  des  points  n'est  pas 


(  1  )  On  en  trouvera  une  très  détaillée  dans  l'ouvrage  cité  de  M  de  Mom- 
TE8SU8,  p.  44-47. 
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telle  qu'ils  puissent  être  tous  unis  par  une  courbe.  Le  gra- 
phique est  alors  construit  et  l'on  dispose  des  éléments  né- 
cessaires à  la  comparaison  de  la  courbe  théorique  et  de 
celle  des  fréquences  observées. 


Fis.  43. 


412.  A  part  un  cas  isolé,  les  points  de  fréquence  obser- 
vée sont  restés  en  dessous  de  la  courbe  théorique.  Il  n'y  a 
donc  pas  assimilation  complète  entre  la  loi  du  hasard  et  la 
loi  de  nature  physiologique,  qui  règle  la  fréquence  des 
naissances  masculines  parmi  les  individus  nés  vivants. 
Mais  quelle  est  la  mesure  de  cet  écart?  On  peut  la 
concevoir  comme  exprimant  la  chance  d'atteindre,  au 
moyen  d'un  tirage  au  sort,  le  point  correspondant  sur  la 
courbe  théorique.  M.  Carvallo  partant  de  cette  idée  a  éta- 
bli une  méthode  simple  d'exprimer  l'écart  en  question. 

Prenons  sur  la  courbe  des  fréquences  observées  le  point 
le  plus  proche  de  l'unité  de  l'échelle  des  écarts,  et  appe- 
lons-le V.  La  valeur  de  ce  point  est  t  =  0.9708,  q>  (t)  = 
0.692,  d'après  le  tableau  de  distribution  inséré  au  n°  410. 

En  tirant  de  ce  point  une  ligne  horizontale  vers 
la  gauche,  cette  ligne  coupe  la  courbe  théorique  au 
point  0.69  qui  correspond  à  la  mesure  t  =  0.72. 
C'est   donc   à   l'écart  théorique   t   =  0.72   et  non  à 
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l'écart  observé  t  —  0.97  que  devrait  correspondre  la  fré- 
quence &  (f)  =  0.092.  Donc  les  écarts  observés  sont  trop 
grands.  Mais  dans  quelle  mesure  le  sont-ils? 

Prenons  d'abord  la  différence  entre  la  fréquence  du 
point  V  sur  la  courbe  des  observations  et  la  probabilité 
correspondante  P  que  nous  obtenons  en  menant  une  ver- 
ticale de  V  sur  la  courbe  des  observations,  à  P  sur  la  courbe 
théorique;  la  valeur  cherchée  est  inscrite  en  regard  sur 
l 'échelle  des  probabilités. 

V  ==  0.9708  P  =  0.8299 


Nous  obtenons  ces  valeurs  indifféremment  par  le  gra- 
phique ou  par  la  table. 

D'après  la  position  de  V  sur  la  courbe  observée,  nous 
avons  la  valeur 

t  =  0.97 


et  la  probabilité  de  sortir  un  écart  inférieur  est  donnée  par 
la  table  qui  indique 

P  (t)  =  0.8299 

Donc, 

P  —  cp  =  0.83  —  0.69  =  0.14 

Les  années  observées  sont  au  nombre  de  26  (N).  L'écart 
étalon  sera 

B=  |/ 2fM196~  P)  -  (/MÎ08  =  0.10392 
L'écart  réduit 

X  0.14 
1  =  1  =   U.103*J2  =  134- 

Or,  d'après  la  table,  h  t  =  1.34  correspond  la  valeur 
0.9419. 
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Il  y  aurait  donc  à  parier  94  contre  6  que  le  point  V  serait 
au-dessus  de  la  position  qu'il  a  sur  le  graphique  s'il  y  avait 
assimilation  complète  avec  la  loi  du  hasard  ;  en  conséquence 
0.94  marque  la  défaveur  jetée  sur  la  série  par  la  position 
du  point  V. 

III.  —  La  loi  des  erreurs. 

413.  La  loi  des  erreurs,  qu'on  désigne  parfois  sous  le  nom 
de  loi  de  Gauss,  prend  une  expression  mathématique  assez 
compliquée  que  nous  définirons  plus  loin,  mais  les  don- 
nées de  l'expérience  suffisent  pour  en  comprendre  la  na- 
ture et  la  portée. 

C'est  un  fait  universellement  connu  et  admis,  qu'aucune 
mesure  obtenue  par  l'observation  n'est  rigoureusement 
exacte;  tantôt  ce  sont  les  moyens  dont  nous  disposons  qui 
sont  insuffisants  pour  atteindre  l'exactitude  absolue,  tan- 
tôt ce  sont  les  conditions  du  milieu  où  se  fait  l'observation 
qui  sont  défavorables,  tantôt  ce  sont  les  qualités  de  l'ob- 
servateur lui-même  qui  ne  sont  pas  à  la  hauteur  de  sa 
tâche.  Imperfection  des  instruments  d'investigation,  er- 
reurs de  l'observateur,  conditions  défectueuses  du  travail 
se  combinent  ainsi  pour  éloigner  de  la  vérité  absolue,  dans 
une  mesure  plus  ou  moins  notable,  le  résultat  de  notre  tra- 
vail. Un  exemple  ne  sera  pas  inopportun  pour  préciser  ce 
qui  vient  d'être  dit.  Nous  l'emprunterons  à  Quetelet,  qui 
fut  un  précurseur  dans  cette  question  en  étendant  la  loi 
des  erreurs1  de  son  domaine  mathématique  à  l'observation 
des  plantes  et  des  êtres  humains.  Dans  son  célèbre  ouvrage 
sur  la  théorie  des  probabilités,  l'illustre  statisticien  et  so- 
ciologue s'exprime  comme  suit  au  sujet  des  erreurs  qu'on 
relève  dans  les  observations  astronomiques  (1)  :  «  Un  ob- 


(1)  Quetelet,  Lettres  sur  lu  théorie  des  probabilités,  lettre  XIX.  Bru- 
xelles, Hayez,  1846,  pp.  124-125. 
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servateur  peut  assigner  la  position  d'un  astre  sans  avoir 
à  craindre  des  erreurs  qui  s'élèvent  à  plus  de  trois  à  qua 
tre  secondés  en  arc,  c'est-à-dire  que  la  distance  dont  il  peut 
se  tromper  équivaut,  au  plus,  à  la  largeur  de  la  petite 
bande  du  ciel  que  nous  cacherait  un  fil,  tendu  à  plusieurs 
pieds  de  distance  devant  nos  yeux.  Cependant  un  grand 
nombre  de  causes  peuvent  donner  naissance  à  cette  erreur, 
et  nous  nous  plaçons  ici  dans  l'hypothèse  la  plus  défavo- 
rable; nous  supposons  qu'elles  tendent  toutes,  dans  le 
même  sens,  à  donner  une  valeur  soit  trop  grande,  soit  trop 
petite.  Ainsi,  quelque  précis  que  soit  l'instrument,  il  n'est 
pas  parfait  clans  toutes  ses  parties  :  quelles  que  soient 
l'adresse  et  l'expérience  de  l'observateur,  son  coup  d'œil 
n'est  pas  infaillible;  l'air  peut  être  dans  des  circonstances 
plus  on  moins  défavorables  :  nous  ne  voyons  les  astres 
que  du  fond  de  l'atmosphère  où  nous  sommes  plongés;  et, 
à  cause  des  réfractions,  ils  ne  sont  réellement  pas  dans  les 
lieux  où  nous  les  apercevons.  » 

On  pourrait  multiplier  ces  exemples.  Il  n'est  pas  inu- 
tile de  faire  remarquer  que  les  erreurs  accidentelles  d'ob- 
servation peuvent  chacune  provenir  de  plusieurs  causes 
et  non  d'une  cause  unique.  Ainsi,  écrit  M.  Th.-W.  Wright, 
en  lisant  un  angle  au  théodolite,  l'erreur  trouvée  peut  être 
le  résultat  de  la  construction  imparfaite  de  l'instrument 
ou  du  manque  de  précision  dans  la  façon  dont  l'observateur 
manie  son  instrument.  Chacune  de  ces  causes  peut  être  le 
résultat  d'influences  diverses  :  ainsi  la  première  nommée 
englobe  les  erreurs  de  collimation  de  niveau,  etc.  (1). 

Pour  chacun  de  ces  cas,  nous  supposons  que  l'observa- 
teur est  de  bonne  foi  et  que  les  instruments  dont  il  se  sert 
ne  sont  pas  construits  de  façon  à  donner  une  erreur  systé- 
matique. 11  faut  que  les  erreurs  soient  accidentelles;  c'est 
la  condition  essentielle  pour  qu'on  se  trouve  dans  le  do- 


(])  Wright  (Thomas-Walton),  The  adjustment  of  observations.  New 
York,  1906,  p.  17. 
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maine  du  calcul  des  probabilités;  aussitôt  qu'on  s'en 
éloigne,  dès  qu'on  suppose  que  des  erreurs  systématiques 
interviennent,  on  est  en  dehors  du  calcul  et  de  ses  règles. 

Les  erreurs  accidentelles  ne  sont-elles-  soumises  à  au- 
cune loi?  Se  produisent-elles  indifféremment  dans  tous  les 
cas?  Il  suffit  d'un  instant  de  réflexion  pour  s'apercevoir 
que  rien  ne  semble  moins  probable.  Il  est  aisé  de  se  trom- 
per d'une  petite  quantité  dans  une  observation  :  le  plus 
habile  observateur  peut  mal  lire  un  résultat,  laisser  échap- 
per l'un  ou  l'autre  élément  d'une  importance  relative.  Par 
contre,  les  erreurs  grossières  sont  rares  ;  il  faut  imaginer, 
pour  les  rendre  explicables,  une  série  de  circonstances  bi  - 
zarres qui  ne  peuvent  se  trouver  réunies  que  rarement. 
Un  bon  nombre  de  petites  erreurs,  quelques  rares  erreurs 
sérieuses,  tel  paraît  bien  être  le  bilan  d'une  série  d'obser- 
vations faites  avec  soin.  D'autre  part  il  y  aura  tou- 
jours des  erreurs;  il  n'est  pas  possible  de  les  élimi- 
ner toutes  :  «  L'expérience  prouve,  dit  M.  Gruey,  que 
les  diverses  mesures  d'une  même  grandeur,  faites  soi- 
gneusement avec  toute  la  précision  dont  la  méthode  em- 
ployée est  susceptible  et  purgées  de  toutes  les  erreurs  sys- 
tématique», présentent  encore  de  petites  différences.  » 

Enfin,  si  nous  connaissons  la  valeur  centrale  de  toutes 
les  erreurs,  celle  qui  est  également  éloignée  de  la  plus  pe- 
tite et  de  la  plus  grande,  ces  mots  étant  entendus  dans  le 
sens  de  l'arithmétique,  nous  devons  reconnaître  qu'il  y  a 
une  probabilité  égale  à  ce  que  les  erreurs  se  produisent 
dans  l'un  ou  l'autre  sens  et  prennent,  par  rapport  à  cette 
valeur  centrale,  le  signe  positif  ou  le  signe  négatif. 
Ce  sont  précisément  ces  caractères  qui  sont  mis  en 
évidence  par  la  formule  de  Gauss.  Quant  à  la  dé- 
monstration,  ce  sont,  comme  le  dit  M.  Borel,  les  rai- 
sons   les    plus    simples    qui    sont   les    meilleures  (1). 


(1)  Emile  Borel,  Eléments  de  la  théorie  des  probabilités .  Paris,  Hermann 
et  Fils,  1900,  p.  129. 
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C'est  à  tel  point  <iue  ce  mathématicien  de  talent  es- 
time inutiles,  en  présence  de  la  valeur  démonstrative  des 
vues  logiques,  les  développements  mathématiques  donnée 
à  la  question;  il  ne  lui  semble  pas  que  les  résultats  obtenus 
dans  cette  voie  aient  une  importance  en  rapport  avec  l'ef- 
fort analytique  qu'ils  exigent.  L'hypothèse  de  l'ingénieur 
allemand  G.  Hagen  (1797-1884),  dans  un  ouvrage  élémen- 
taire qui  contient  un  exposé  original  de  la  théorie  des  er- 
reurs, est  aujourd'hui  admise  de  plus  en  plus  par  les  au- 
teurs qui  écrivent  sur  le  calcul  des  probabilités.  On  peut 
admettre,  dit  Hagen,  que  dans  chaque  espèce  d'observa- 
tions, il  existe  un  certain  nombre  indéterminé  d'erreurs 
élémentaires,  indépendantes  les  unes  des  autres,  qui,  prises 
d'une  manière  absolue,  sont  de  même  grandeur  et  peuvent 
être  indifféremment  positives  ou  négatives.  C'est  la  somme 
algébrique  de  ces  erreurs-  élémentaires  qui  forme,  dans 
chaque  cas  particulier,  la  véritable  erreur  existante  (1) 

414.  Avant  tout,  nous  devons  revenir  en  deux  mots  sur 
le  sujet  de  la  moyenne.  Nous  avons  montré  que  de  toutes 
les  valeurs  différentes  que  prennent  les  observations  faites 
d'une  quantité  unique,  la  moyenne  était  la  plus  exacte  et 
que  quand  le  nombre  des  valeurs  observées  est  très  grand, 
la  moyenne  arithmétique  était  la  valeur  véritable.  D'autre 
part,  après  avoir  précisé  la  notion  de  l'écart,  nous  avons 
montré  :  a)  que  la  somme  algébrique  des  écarts  est  égale 
à  zéro;  b)  que  la  somme  des  carrés  des  écarts  d'après  la 
moyenne  arithmétique  constitue  un  minimum.  L'étude  de 
la  moyenne  nous  a  aussi  conduit  à  cette  conclusion  que  si 
l'on  dispose  d'un  matériel  dont  les  éléments  ont  une  va- 
leur identique  sous  le  rapport  de  l'observation,  on  doit 
trouver  que  les  erreurs  en  trop  ou  par  défaut  se  partagent 
d'une  manière  égale  autour  de  la  moyenne,  c'est-à-dire 


(1)  Cfr.    Boudin-Mansion.  Cours,  loc.  cit.,  pp.  154  et  289. 
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qu'elles  présentent  une  égale  probabilité.  Nous  avons 
dit  que  l'expérience  démontre,  comme  il  est  naturel, 
la  rareté  des  erreurs  considérables  et  la  fréquence 
des  petites  erreurs.  Les  unes  comme  les  autres  se  rangent 
autour  de  la  moyenne;  leur  nombre  augmente,  de  part  et 
d'autre,  à  mesure  qu'on  se  rapproche  de  zéro,  de  sorte 
qu'il  est  permis  de  dire  que  l'arrivée  des  erreurs  en  nom- 
bre plus  ou  moins  grand  est  une  fonction  de  l'erreur  elle- 
même.  M.  Th.-W.  Wright  (1)  a  fait  l'exposé  suivant  de  la 
genèse  de  la  formule  de  la  loi  des  erreurs;  nous  le  repro- 
duisons intégralement  à  cause  de  sa  clarté  : 

Appelons  /  (A)  la  probabilité  qu'une  erreur  prenne 
place  entre  0  et  A  ;  et  désignons  par  q  la  probabilité  qu  'une 
autre  erreur  se  rencontre  entre  A  et  A  -j-  d  A .  Nous 
avons  : 

q  =  f(A  +  d  A)  —  /  (A)  =  f  (A)dA  =  cp  [A)dA.  (87) 

La  fonction  <p  (A)  est  appelée  loi  de  distribution  des  er- 
reurs. 

Si  nous  voulons  exprimer  la  probabilité  qu'une  certaine 
erreur  tombe  entre  les  limites  a  et  6  de  la  courbe,  nous 
avons  à  calculer  la  probabilité  q>  (A)  d  A  étendue  aux 
limites  sus  indiquées,  ce  qui  nous  donne  l'intégrale  : 


La  probabilité  qu'une  erreur  donnée  ne  dépasse  pas  la 
limite  a  s'exprime  ainsi  : 


La  probabilité  totale  de  l'arrivée  simultanée  de  toutes 
les-  erreurs  possibles  est  la  somme  des  probabilités  calcu 


88) 


cp  (A)  d  A. 


(89) 


(1)  Th.  W.  Wright,  loc.  cit.,  pp.  13  et  suivantes. 
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lées  pour  chaque  erreur  séparément.  Désignons-la  par  Q. 
La  probabilité  de  la  rencontre  de  l'erreur  A!  est  cp  (A,) 
d  A,  et  ainsi  de  suite  pour  A2  ,  .  .  .  .  Afl  ;  nous  avons  en 
conséquence  : 

U  =  cp  (A,)  cp  (A2)  cp  (A„)  d  Aj,  d  A2  d  A„  .  (90) 

Q  est  un  maximum  et  son  logarithme  partage  la  même 
propriété.  En  établissant  les  différences-  par  rapport  à  x, 
inconnue  dont  il  faut  déterminer  la  valeur  la  plus  pro- 
bable, on  a  : 

Q  =  d  (log.  Q)  =  qp'(A|)  d  At      (p'(A2)  d  A2  <p*  JAnj  dAn 

dx  cp  (A,)    dx       cp  (A2)   dx  cp  (A,J  dx 

tP'(A''    A,+7^  A2  +   J££SL.A.  (94, 


A,  cp  (Aj)    1  1  A2  (p  (A2)  An  <p  (A„ 

or, 

d  A(i 


Nous  savons  que  si  le  nombre  des  erreurs  d'observation 
est  très  grand,  ces  erreurs  se  compensent  et  ont  pour  ex- 
pression finale  zéro. 

Nous  avons  donc  : 

<P'  (Ai)  cp'(A2)  cp'  (A)t)    =  K 


Aj  cp  (AJ  A2  cp  (A2)  A„  cp  (A, 

A  toute  valeur  arbitraire  A ,  correspond  donc  l'expres- 
sion générale  : 

cp'  (A) 


Acp  (A) 


=  K. 


Par  intégration  et  simplification,  on  a  : 

cp  (A)  =  c  e  *  K  A"  (93) 

expression  dans  laquelle  e  est  la  base  du  système  népérien 
de  logarithmes  et  c  est  une  constante  à  déterminer. 
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Puisque  Q  est  un  maximum,  (—à  ou  rf2  (|o£-  Q)  doit  être 
H  (/X2  (/a:2 

une  expression  négative.  D'où 

4  (A^  +  A22  -4-...) 

dil2|_Q)  =  K(A1+A2  +  ...) 

d2^#  =  K(A1+A2  +  ...) 

En  conséquence,  puisque  w  est  positif,  K  doit  être  néga- 

A 

tif  et  prenant  la  valeur  -  K  ==  — h2,  nous  avons 

A 

cp  (  A)=  c  e  (M) 
ce  qui  donne  la  loi  d'erreur  cherchée. 

Il  faut  maintenant  déterminer  c  et  h.  Il  est  certain  que 
toutes  les  erreurs  se  trouvent  entre  les  limites  +  a  et  —  a. 
Par  conséquent  : 

c  f+fl  e-h2A\lA=  1  (95) 
J  — a 

Mais  comme  les  valeurs  de  a  sont  différentes  pour  cha- 
que observation  particulière,  il  est  préférable  de  rempla- 
cer —  a  et  +  a  par  le  signe  général  +  oc  — •  oo  comme  dé- 
signant les  limites  extrêmes  de  l'erreur  et  d'écrire  l'ex- 
pression générale  : 


J   00 

Il  vient  que 


h 


(96) 


et  la  loi  des  erreurs  peut  être  écrite  : 

q>(A)  =  -]==  e~h%ù?  (97) 

V  TT 

k  est  une  mesure  de  la  qualité  des  observations  ;  Gauss 
lui  a  donné  le  nom  de  mesure  de  la  précision  des  observa 
tions. 
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Cette  équation  a  pour  expression  graphique  une  courbe 
symétrique  dans  laquelle  la  moyenne,  la  médiane  et  le 
mode  coïncident;  elle  est  la  courbe  idéale  de  distribution. 
Elle  porte  le  nom  de  courbe  des  erreurs,  ou  loi  des  erreurs. 

415.  Pour  représenter  graphiquement  la  courbe  normale 
des  erreurs,  on  se  sert  pratiquement  de  tables  calculées  à 
l'avance  donnant  les  ordonnées  de  la  courbe,  tables  que  les 
mathématiciens  connaissent  sous  le  nom  de  tables  de  pro- 
babilité intégrale.  Si  l'on  considère  la  courbe  comme  di- 
visée en  100  parties  égales  dont  les  49  premières  divisions, 
en  dessous  de  50",  auraient  une  valeur  négative  et  les 
49  dernières  divisions,  au-dessus  de  50°,  prendraient  une 
valeur  positive,  les  déviations  par  rapport  à  la  moyenne 
s'expriment  en  valeurs  normales,  comme  suit  (1)  : 

5°  =  2.44  60°  =  0.38 

10°  -  4.90  70°  =  0.78 

20°  =  1.25  o0"  =  0    80°  -  1.25 

30°  =  0.78  90°  =  1.90 

40°  =  0.38  9o°  =  2.44 

La  courbe  des  erreurs  présente  des  particularités  dignes 
de  remarque  : 

1°  Elle  est  symétrique  par  rapport  à  l'axe  des  y,  c'est- 
à-dire  que  son  développement  de  part  et  d'autre  du  centre 
est  identique,  mais  les  valeurs  qu'elle  prend  de  part  et 
d'autre  sont  opposées  étant  de  signe  contraire; 

2°  Elle  diminue  rapidement,  s'abaissant  vers  l'axe  des 
abcisses,  indiquant  ainsi  que  la  probabilité  de  commettre 
une  erreur  diminue  à  mesure  que  l'erreur  devient  plus 
grande  ; 

3°  Elle  est  asymptotique  par  rapport  à  l'axe  des  abcisses, 
c'est-à-dire  qu'elle  s'en  rapproche  constamment  sans  se 


(1)  Francis  Gai.ton,  Natural  Inheritance,  table  3,  p.  201 
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confondre  avec  lui,  ce  qui  marque  la  possibilité  indéfinie 
de  commettre  une  erreur. 

La  table  de  fréquence  des  erreurs  reproduite  page  669 
donne,  pour  10,000  observations,  le  nombre  théorique  des 
erreurs  comprises  entre  zéro  et  un  nombre  quelconque  pris 
comme  unité  d'écart  ou  erreur  probable. 

La  première  colonne  intitulée  m  contient  une  série  de 
nombres  applicables  à  la  grandeur  de  l'écart  probable  : 
ainsi  0.09  signifie  une  erreur  qui  ne  sera  pas  supérieure  à 
neuf  centièmes  de  l'écart  probable.  Tl  suffit  alors  de  con- 
sulter la  seconde  colonne  indiquant  le  nombre  d'erreurs 
sur  10,000  pour  constater  qu'à  ce  point  0.09  correspond  la 
valeur  484  ;  sur  10,000  chances,  il  y  a  donc  484  chances  pour 
que  l'erreur  commise  ne  dépasse  pas  9/100  de  l'écart  proba- 
ble et  de  ce  nombre  242  seront  positives  et  242  négatives. 
Entre  deux  divisions  de]  a  table,  toute  division  intermédiaire 
a  pour  valeur  la  moitié  de  la  différence  entre  les  chiffres 
indiqués  à  chacune  de  ces  divisions  :  ainsi  1.34  (m)  a  pour 
valeur  6339;  1.36  (m)  correspond  au  chiffre  6410;  donc  1.35 


règle  d'interpolation  est  applicable  à  tous  les  écarts  qu'on 
trouvera  dans  la  table. 

416.  Fm  utilisant  des  tables  de  réduction  spéciales,  on 
parvient  facilement  à  comparer  la  distribution  théorique 
avec  la  distribution  observée. 

Nous  avons  déjà  reproduit,  d'après  M.  Carvallo, 
une  de  ces  tables.  M.  Benini  (1)  en  a  calculé  une  autre 
dans  laquelle  la  valeur  de  6  (t)  est  exprimée  en  pour  cent, 


(1)  Benini,  Principi  di  statistica  metodologica .  Torino,  1906, 
p.  230.  Cette  table  n'est  autre  que  la  table  modifiée  et  simplifiée  de 
l'intégrale  : 


table  que  l'on  trouve  sous  la  forme  précédente  dans  tous  les  traités  de 
probabilités . 


prend  la  valeur 


6410 


6339 


=  y  +  6339  =  6374.5.  Cette 
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ce  qui  est  d'une  grande  utilité  pour  les  travaux  de  statis- 
tique pratique.  Nous  la  reproduisons  ci-après  : 
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80 

A 
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0 
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31 

0 
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56 

0 
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81 

0 
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7 

0 
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32 

0 
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57 

o 
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82 

0 
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0 
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33 

A 

U 
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58 
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83 
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9 
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34 
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u 
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59 
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84 

U 
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10 

A 

u 
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35 
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60 

A 

U 

OJOl 

85 

1 
1 
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11 

0 
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36 

0 
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61 

0 

6078 

86 

î 

0436 

12 

0 
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37 

0 

3406 

62 

0 
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87 

î 

0707 

13 

A 

u 

1  1 

38 

A 

u 

oDUD 

63 

A 

88 

1 
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14 

U 
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39 

A 

U 
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64 

A 
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89 
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1 
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15 

A 

U 
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40 

A 

U 

65 
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U 
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90 

1 

16 

0 

14-28 

41 

0 

3810 

66 

0 

0747 

91 

1 

1988 

17 

0 

1518 

42 

0 

3913 

67 

0 

6888 

92 

1 

2379 

18 

0 

1609 

43 

0 

4017 

68 

0 

7032 

93 

1 

2812 

19 

0 

1700 

44 

0 

4121 

69 

0 

7179 

94 

3299 

20 

0 

1791 

45 

0 

4227 

70 

0 

7329 

95 

1 

3859 

21 

0 

1883 

46 

0 

4333 

71 

0 

7482 

96 

1 

4522 

22 

0 

1975 

47 

0 

4441 

72 

0 

7639 

97 

1 

5345 

23 

0 

2067 

48 

0 

4549 

73 

0 

7800 

98 

1 

6450 

24 

0 

2160 

49 

0 

4659 

74 

0 

7965 

99 

1 

8214 

25 

0 

2253 

50 

0 

47693 

75 

0 

8134 

En  multipliant  les  valeurs  de  m  portées  à  la  table  de  fré- 
quence des  erreurs  par  la  constante  0.47693,  on  obtient  les 
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valeurs  de  t  mentionnées  à  la  table  ci-dessus.  Pour  con- 
fronter la  distribution  observée  à  la  distribution  théorique, 
il  faut  d'abord  calculer  Pécart  probable  et  faire  cet  écart 
égal  à  l'unité.  Il  faut  ensuite  réduire  à  la  même  base  la  me- 
sure des  erreurs  ordonnées  et  chercher  son  équivalent  dans- 
la  colonne  m  de  la  table  de  fréquence  des  erreurs. 

Si  l'interpolation  doit  être  faite,  on  la  calcule  et  on  ht  le 
nombre  dans  la  colonne  en  regard  de  m,  en  réduisant,  si 
on  le  désire,  à  la  proportion  sur  100. 

Les  erreurs  effectives  étant  d'abord  réduites  à  leur  pro- 
portion sur  100,  on  inscrit  en  regard  les  nombres  calculés 
d'après  la  table  et  on  compare  les  deux  séries.  (Voir  ci- 
contre  la  table  de  fréquence  des  erreurs.) 


417.  Pour  comparer  une  courbe  quelconque,  obtenue  par 
l'observation,  avec  la  courbe  théorique  normale,  M.  Da- 
venport  (1)  donne  la  méthode  suivante  :  s'il  s'agit  d'une 
courbe  ordinaire  à  ordonnées  réunies  par  une  ligne  brisée 
ou  par  une  courbe,  la  fréquence  théorique  pour  chaque 

classe  à  l'écart  ~  (x  étant  l'écart  par  rapport  à  la  moyenne 

et  a  étant  l 'écart  type  ou  standard  déviation)  peut  être  prise 

directement  dans  la  table  insérée  p.  672.  Dans  ce  cas  -  est 

a 

l'écart  actuel  d'après  la  moyenne  exprimée  en  unités  de  la 
standard   déviation  et  JL  l'ordonnée  correspondante,  y 

Va  0 

étant  pris  comme  égal  à  l'unité. 

La  méthode  suivante  est  suivie  pour  obtenir  l'entrée  de 
la  table  : 

Grouper  en  premier  lieu  les  données  de  la  manière  indi- 
quée pour  trouver  la  moyenne  par  la  méthode  indirecte 
(Cfr.  n°  229)  c'est-à-dire  en  déterminant  une  origine  arbi- 
traire Vo  vers  le  milieu  de  la  série  et  en  donnant  à  chaque 
classe  placée  au-dessus  une  valeur  négative  croissante  (1, 


(1)  G.  B.  Davenpokt,  Stdtistiriil  Methods,  \>\>.  23  et  105. 
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Table  de  fréquence  des  erreurs  sur  10000 


m 

Nombre 

des  . 
erreurs 

m 

Nombi  e 

des 
erreurs 

m 

Non,  lire 

des 
erreurs 

m 

Nombre 

des 
erreurs 

0 

0 

0 

r\  Ci 

bz 

3242 

1 

O  A 

34 

6339 

o 

2 

65 

9261 

0  01 

54 

0 

f*  i 
b* 

3340 

1 

OO 

64  1 0 

o 

70 

9314 

0.02 

108 

0 

ce 

oo 

3438 

1 

ob 

6480 

75 

9364 

0.03 

161 

0 

68 

3535 

i 
1 

An 

6550 

o 

2 

80 

9411 

0.04 

215 

0 

70 

3632 

1 

AO 

4-s 

6618 

2 

85 

9454 

0.05 

269 

0 

12 

3728 

■ 

l 

A  t 
4  i 

6686 

o 
i! 

90 

9495 

0.06 

323 

0 

74 

3823 

i 
1 

AC\ 
4o 

6753 

95 

9534 

0.07 

377 

0 

là 

3918 

i 
1 

A  W 

6818 

o 
O 

0(i 

9570 

0.08 

430 

0 

78 

4012 

i 
1 

OU 

6883 

3 

05 

9603 

0  09 

484 

0 

80 

4105 

i 
1 

6947 

o 
o 

10 

9635 

0.10 

538 

0 

82 

4198 

i 
1 

KA 

04 

7011 

6 

15 

9664 

0. 12 

645 

0 

84 

4290 

1 

OD 

7073 

3 

20 

9691 

0.14 

752 

0 

86 

4381 

1 

eo 
Oo 

7134 

3 

or 

25 

9716 

0.16 

859 

A 

0 

88 

4472 

1 

OU 

7195 

3 

on 

30 

9740 

0.18 

966 

0 

90 

4562 

1 

04 

7313 

à 

35 

9762 

0.20 

1073 

0 

92 

4651 

1 

fin 

7428 

Q 
O 

a  n 
40 

9782 

0.22 

1180 

0 

94 

4739 

i 

*70 

12 

7540 

•J 
à 

A  X 

4o 

9800 

0.24 

1286 

0 

96 

4827 

1 

/  O 

7648 

Q 
O 

Kn 

oO 

9818 

0.26 

1392 

0 

98 

4914 

i 
1 

on 
OU 

7753 

Q 
O 

55 

9834 

0.28 

1498 

1 

00 

5000 

i 

04 

7854 

o 
à 

an 
OU 

9848 

0.30 

1604 

1 

02 

5085 

i 
1 

QQ 
OO 

7952 

3 

/•  — 

OO 

9862 

0.32 

1709 

1 

04 

5170 

1 

no 

8047 

3 

Tn 
70 

9870 

0.34 

1814 

1 

06 

5254 

1 

n*2 
96 

8138 

o 

o 

on 

80 

9896 

0.36 

1919 

1 

08 

5337 

o 

nn 
UU 

8227 

6 

nn 
90 

9915 

0 . 38 

2023 

1 

10 

5419 

O 

nK 

05 

8332 

4 

nn 
00 

9930 

0.40 

2127 

1 

12 

5500 

o 

1  n 
10 

8433 

4 

i  n 
10 

9943 

0.42 

2230 

1 

14 

5581 

2 

15 

8530 

4 

20 

9954 

0.44 

23:^4 

1 
1 

1  o 

56ii0 

9 

8622 

A 
4 

ou 

9963 

0.46 

2436 

1 

18 

5739 

2 

.25 

8709 

4 

40 

9970 

0  48 

2531) 

1 

20 

5817 

2 

30 

8792 

4 

50 

9976 

U  ,)0 

264 1 

1 

22 

5S94 

2 

35 

8870 

4 

60 

9981 

0.52 

2742 

1 

24 

5971 

2 

40 

8945 

4 

.70 

9985 

0.54 

2843 

1 

26 

6046 

2 

45 

9016 

4 

.80 

99.S8 

0.56 

2944 

1 

28 

6121 

2 

.50 

9082 

4 

.90 

9991 

0.58 

3044 

1 

30 

6194 

2 

55 

9146 

5 

.00 

9993 

0.60 

3143 

1 

32 

6267 

2 

.60 

9205 
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2,  3,  etc.)  et  à  chaque  classe  située  au-dessous  de  l'origine 
une  valeur  positive  croissante  d'après  la  même  progres- 
sion ;  la  moyenne  est  égale  au  chiffre  de  la  classe  (V)  aug- 
menté de  Vij  cette  dernière  valeur  dont  nous  n'avons  pas 
encore  parlé  est  formée  par  une  fraction  dont  le  numéra- 
teur est  la  somme  algébrique  des  produits  V  —  V0  par 
les  fréquences,  et  le  dénominateur  est  la  somme  des  fré- 
quences. Nous  avons  indiqué  plus  haut  le  procédé  pour 
trouver  la  standard  déviation  (Cfr.  n°  285).  Il  faut  encore 
déterminer  la  fréquence  y  et  la  valeur  y  :  celle-ci  est  don- 
née par  la  formule  n 

et  correspond  à  la  fréquence  maximum. 

Eclaircissons  la  matière  en  l'illustrant  d'un  exemple 
numérique. 

Reprenons  les  données  utilisées  à  l'exemple  1  du  cha- 
pitre II.  (Livre  II.) 


Pimpinella  Sax;fraga  L 


Classes 

(0 

m 

if-  D 

(f. 

5 

1 

—  6 

—  6 

36 

6 

5 

—  5 

—  25 

125 

7 

••'  9-V, 

—  4 

—  36 

144 

8 

22 

—  3 

—  66 

198 

9 

38 

—  2 

—  76 

152 

10 

62 

'  ■  's  i , 

—  62 

62 

11 

61 

0 

—  271 

12 

29 

1 

29 

29 

13 

14 

2 

28 

56 

14 

4 

3 

12 

36 

15 

4 

4 

16 

64 

+  85 

902 

I.A  LOI  DES  ERREURS. 

I  (f.  i)  =  —  271  !  88  -  —  186 
M  -  A  =  -         =  -  0  747  M      H  +  (-  0  7 17, 

n 

y» 


2ifl 


249- 


io.2;>:; 


gr|/2Ït     4.903X2.50662»      4.770 1 1  au«4 

Le  tableau  pour  la  comparaison  avec  la  courbe  théo- 
rique se  dispose  comme  suit  : 


Classes 
V 


Ecarts 
à  M 


V  —  M 

a 


Valeurs 
d'après 
la  table 


Va 


5 

—  6.253 

3 

.28 

0,0013 

X 

52.2  = 

0,06786 

1 

6 

-5.253 

2 

.76 

0,0222 

X 

52.2  = 

1,15884 

5 

7 

—  4.253 

2 

23 

0,0832 

X 

52.2  = 

4,34304 

9 

8 

—  3.253 

1 

71 

0,2318 

X 

52.2  = 

12,09996 

22 

9 

—  2.253 

1 

18 

0,4985 

X 

52.2  = 

26,02170 

38 

10 

—  1 .253 

0 

65 

0,8096 

X 

52.2  = 

42,26112 

62 

11 

253 

0 

13 

0,9916 

X 

52  2  = 

51 ,76152 

61 

12 

1.747 

0 

92 

0,6549 

X 

52.2  = 

34,18578 

29 

13 

2.74< 

1 

44 

0,3546 

X 

52.2  = 

18,51012 

14 

14 

3.747 

1 

97 

0,1436 

X 

52.2  = 

7,49592 

4 

15 

4.747 

2 

49 

0,0450 

X 

52.2  = 

2,34900 

4 

Les  valeurs  de 


V  —  M 


sont  calculées  dans  la  table  sui- 


vante intitulée  :  table  des  ordonnées  (x)  de  la  courbe  nor- 
male (I).  Dans  la  quatrième  colonne  du  tableau  qui  pré- 
cède non?  avons  porté  les  valeurs  lues  dans  la  table  ;  dans 
la  cinquième  sont  portées  les  valeurs  des  ordonnées  de  la 
courbe  théorique  et  dans  la  sixième  sont  répétées  les  fré- 
quences observées. 


(1)  C.  B.  Davenport,  Statistical  methwte .  New  York,  1004,  p.  118. 
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c 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

0.0 

100000 

99995 

99980 

99955 

99920 

99875 

99820 

99755 

99685 

99596 

0.1 

99501 

99396 

99283 

99158 

99025, 

98881 

98728 

98565 

98393 

98211 

0.2 

98020 

97819 

97609 

97390 

97161 

96923 

96676 

96420 

96156 

95882 

0  3 

95600 

95309 

95010 

94702 

94387 

94055 

93723 

- 

93382 

93034 

92677 

0.4 

92312 

91939 

91558 

91169 

90774 

90371 

89961 

89543 

89119 

88688 

0.5 

88250 

87805 

87353 

86896 

86432 

85962 

85488 

85006 

84519 

84060 

0.6 

83527 

83023 

82514 

82010 

81481 

80957 

80429 

79896 

79359 

78817 

0.7 

78270 

77721 

77167 

76610 

76048 

75484 

74916 

74342 

73769 

73193 

0  8 

72615 

72033 

71448 

70861 

70272 

69681 

69087 

68493 

67896 

67298 

0  9 

66698 

66097 

65494 

64891 

64287 

63683 

63077 

62472 

61865 

61259 

i.fl 

60653 

60047 

51440 

58834 

58228 

57623 

57017 

56414 

55810 

55209 

11 

54607 

54007 

53409 

52812 

52214 

51620 

51027 

50437 

49848 

49260 

1.2 

48675 

48092 

47511 

46933 

46857 

45783 

45212 

44644 

44078 

43516 

1.3 

42956 

42399 

41845 

41294 

40747 

40202 

39661 

39123 

38589 

38058 

1.4 

37531 

37007 

36487 

35971 

35459 

34950 

34445 

33944 

33447 

32954 

1.5 

32465 

31980 

31500 

31023 

30550 

30082 

29618 

29158 

28702 

28251 

1.6 

27804 

27361 

26923 

26489 

26059 

25634 

25213 

24797 

24385 

23978 

1.7 

23575 

23176 

22782 

22392 

22008 

21627 

21251 

20879 

20511 

20148 

1.8 

19790 

19436 

19086 

18741 

18400 

18064 

17732 

17404 

17081 

16762 

1  9 

16448 

16137 

15831 

15530 

15232 

14939 

14650 

14364 

14083 

13806 

2.0 

13534 

13265 

13000 

12740 

12483 

12230 

11981 

11737 

11496 

11259 

2  1 

11025 

10795 

10570 

10347 

10129 

09914 

09702 

09495 

09290 

09090 

2  2 

08892 

08698 

08507 

08320 

08136 

07956 

07778 

07604 

07433 

07265 

2  3 

07100 

06939 

06780 

06624 

06471 

06321 

06174 

06029 

05888 

05750 

2.4 

05614 

05481 

05350 

05222 

05096 

04973 

04852 

04734 

04618 

04505 

2  5 

04394 

04285 

04179 

04074 

03972 

03873 

03775 

03680 

03586 

03494 

2  6 

03405 

03317 

03232 

03148 

03066 

02986 

02908 

02831 

02757 

02684 

2  7 

02612 

02542 

02474 

02408 

02343 

02280 

02218 

02157 

02098 

02040 

2  8 

01984 

01929 

01876 

01823 

01772 

01723 

01674 

01627 

01581 

01536 

2.9 

01492 

01449 

01408 

01367 

01328 

01289 

01252 

01215 

01179 

01145 

3. 

01111 

00819 

00598 

00432 

00309 

00219 

00153 

001(6 

00073 

00050 

4. 

00034 

00022 

00015 

00010 

00006 

00004  | 

00003 

00002 

00001 

00001 

5. 

00000 

i 
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La  méthode  est  différente  si  le  matériel  se  compose 
d'une  série  de  rectangles  ou,  ce  qui  revient  au  moine,  <l,; 
données  intermédiaires  entre  des  limites  de  classes,  comme 
c'est  le  cas  dans  les  statistiques  de  salaires.  On  fait  usage 
alors  de  tables  spéciales  dont  on  trouvera  un  spécimen 
dans  l'ouvrage  cité  de  C.-B.  Davenport  (1). 


418.  (laiton  a  imaginé  un  ap- 
pareil simple  capable  de  repro- 
duire mécaniquement  la  loi  des 
erreurs  ;  cet  appareil  a  été  rema- 
nié par  le  professeur  Karl  Pear- 
son.  Nous  donnerons  brièvement 
la  description  des  deux  appa- 
reils. 

L'appareil  de  (laiton  consiste 
essentiellement  en  une  boîte 
oblongue,  dont  la  face  supérieure 
est  garnie  d'une  vitre;  l'épais- 
seur de  la  boîte,  en  arrière  de  la 
vitre,  est  environ  d'un  quart  de 
pouce  ;  à  la  partie  supérieure, 
deux  pièces  de  bois  sont  dispo- 
sées de  manière  à  former  enton- 
noir. Au-dessous  se  trouvent  une 
quantité  de  lignes  formées 
d'épingles  placées  à  distance 
égale,  en  forme  de  quinconce,  et 
plus  bas  treize  compartiments 
constitués  par  des  bandes  verti- 
cales. On  place  dans  ces  compar- 
timents une  quantité  de  petits  corps  spkériques-  et  on  re- 
tourne l'appareil;  toutes  les  «  balles  »  se  groupent  dans  la 


Fie.  44. 


(1)  C.  B.  Davknport,  Statistical  methods,  p.  119. 
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partie  supérieure.  On  retourne  ensuite  la  boîte  pour  la  pla- 
cer dans  sa  direction  de  travail. 

Des  bandes  latérales  dirigent  les  balles  vers  l'enton- 
noir et  celles-ci  tombent  en  cascade  à  travers  le  réseau 
d'épingles.  Finalement,  elles  se  casent  dans  les  comparti- 
ments verticaux,  en  nombre  inégal,  mais  de  telle  façon  que 
leur  groupement  reproduit  d'une  manière  sensiblement 
approchée  la  forme  caractéristique  de  la  courbe  des  er- 
reurs. En  effet,  chaque  balle  en  tombant  rencontre  une 
série  d'obstacles,  nombreux  et  indépendants,  de  manière 
que  les  accidents  qui  provoquent  un  écart  vers  la  droite 
sont  compensés  par  ceux  qui  causent  une  déviation  vers  la 
gauche;  toutefois  un  grand  nombre  de  balles  en  s 'échap- 
pant de  l'entonnoir  suivent  une  direction  verticale  et  la 
fréquence  des  balles  qui  s'échappent  à  droite  et  à  gauche 
diminue  plus  rapidement  que  n  'augmente  la  distance  sépa- 
rant les  compartiments  extrêmes  de  ceux  du  centre  (1). 

419.  Le  professeur  Pearson  a 
modifié  ce  dispositif  de  façon 
que  les  balles  passant  à  travers 
les  obstacles  en  forme  de  coin 
se  trouvent  dans  le  rapport  q2  : 
pq  :  p2.  Il  a  généralisé  ensuite 
cette  construction  pour  que  les 
coins  amovibles  puissent  être 
disposés  de  façon  à  donner  tout 
rapport  q  :  p. 

Un  entonnoir  s'ouvre  sur  un 
espace  d'un  quart  de  pouce  li- 
mité d'un  côté  par  une  feuille 
de  bois  et  de  l'autre  par  une 
glace.  Au-dessous  de  l'enton- 
noir sont  disposés  des  obstacles 
en  forme  de  coin:  immédiate  - 


(1)  Gai/ton,  Natural  Inher'+-cmee,  ch.  V..   (Normal  Variability  ),  pp.  63-65. 
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ment  en  dessous  se  trouve  un  seul  coin;  à  la  tige  sui- 
vante 2,  à  la  troisième  3.  Plus  bas  que  les  coins  se  1  rouvert 
des  tiges  de  bois  de  même  épaisseur  et  terminées  en  forme 
de  coin;  entre  ces  tiges,  formant  compartiments,  les  balles 
peuvent  se  rassemble]'.  Le  premier  coin  divise  la  masse  des 
balles  en  deux  parties,  l'une  se  dirigeant  vers  la  droite, 
l'autre  vers  la  gauche  de  l'observateur. 

Les  coins  2  et  3  sont  placés  de  façon  à  diviser  les  balles 
dans  la  même  proportion,  de  façon  que  les  balles  passant 
à  travers  ces  obstacles  sont  dans  la  proportion  q2  :  2  p<j  : 
p2  et  plus  loin,  après  la  troisième  ligne  d'obstacles  dans 
celle-ci  :  q'Â  :  3  q2p  :  3  q  p2  :  p's,  et  finalement  dans  La  sui- 
vante :  q4  :  4q3p  :  6  q2  p2  :  4  qps  :  p4  (1). 

IV.  —  Les  types  de  distribution  dérivés. 

420.  La  courbe  des  erreurs  accidentelles  était  connue 
depuis  longtemps  des  mathématiciens  et  des  physiciens, 
mais  elle  ne  l'était  que  sous  sa  forme  idéale,  qui  exige  une 
distribution  des  chances  toute  spéciale.  Les  sciences  firent 
un  grand  progrès  le  jour  où  l'on  s'avisa  que  la  loi  des 
erreurs  accidentelles  pouvait  être  étendue  à  des  phéno 
mènes  connus  par  l'observation;  il  est  juste  de  rappeler 
que  Quetelet  fut  un  précurseur  de  cette  méthode  et  que  la 
voie  qu'il  avait  ouverte  conduisit  à  des  résultats  remarqua- 
bles. L'hypothèse  sur  laquelle  repose  la  conception  actuelle 
de  la  loi  des  erreurs  renferme  une  double  assertion;  à  sa- 
voir :  1°  que  l'erreur  dépend  de  causes  extrêmement  nom- 
breuses; 2°  que  la  fonction  exprimant  cette  dépendance 
peut  être  traitée  comme  une  fonction  linéaire.  La  pre- 
mière de  ces  assertions  paraît  à  la  fois  naturelle  et  exacte. 
((  Dans  toute  observation,  a  écrit  le  D1'  CHaisher,  nous  savons 


(1)  Cfr.  Karl  Peahson  :  Skew  variation  in  homogeneOus  material.  Phil. 
Trans.  Roy.  Soc,  série  A,  1895,  §  1er  et  Udny  Yutje  :  An  introduction  fo 
the  theory  of  Statistics,  pp.  294-295. 
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que  l'exactitude  finale  du  résultat  est  altérée  par  de  nom- 
breuses causes  indépendantes  les  unes  des  autres.  L'état 
de  santé  de  l'observateur,  la  perfection  de  ses  sens,  l'état 
de  l'atmosphère,  la  construction  plus  ou  moins  parfaite 
des  instruments  qu'il  emploie  sont  autant  de  causes  qui 
contribuent  à  faire  naître  des  erreurs.  » 

Il  résulte  de  ceci  que  si  l'on  connaît  la  moyenne  d'une 
série  régulière  et  son  écart  probable,  il  n'est  pas  impos- 
sible de  déterminer  a  priori  le  nombre  des  fréquences  qui 
sont  supérieures  ou  inférieures  à  cette  moyenne,  étant  ad- 
mis que  leur  nombre  probable  est  égal  de  part  et  d'autre. 

Cependant  la  loi  normale  des  erreurs  ne  suffit  pas  à 
rendre  compte  de  tous  les  phénomènes,  car  les-  recherches 
dirigées  dans  le  domaine  des  sciences  biologiques  ont  dé- 
montré que  de  nombreuses  courbes  sont  déviées  et  pré- 
sentent, par  rapport  à  la  courbe  normale,  d'importantes 
altérations.  Les  courbes,  en  dehors  de  la  courbe  normale, 
peuvent  être  plurimodales,  ce  qui  indique  alors  que  le  ma- 
tériel exprimé  par  la  courbe  n  'est  pas  homogène,  mais  qu  'il 
est  composé  de  plusieurs  types  ayant  leur  individualité 
propre.  Quetelet,  sans  avoir  d'exemple  à  présenter  pour 
justifier  son  hypothèse,  avait  déjà  fait  observer  que  si 
deux  races  distinctes  se  trouvaient  comprises  dans  un 
même  recensement,  la  courbe  qui  représenterait  la  hauteur 
des  tailles,  par  exemple,  aurait  deux  sommets  qui  annon- 
ceraient deux  races  différentes  ayant  des  tailles  moyennes 
inégales.  Le  DT  Bertillon,  père,  trouva  un  exemple  remar- 
quable de  ces  courbes  plurimodales  en  analysant  la  taille 
des  conscrits  du  département  du  Doubs;  un  sommet  de  la 
courbe  correspond  aux  tailles  comprises  entre  1  m.  598  et 
1  m.  652;  l'autre  aux  tailles  comprises  entre  1  m.  679  et 
1  m.  706  (1). 

L'analyse  de  ces  courbes  plurimodales  exige  un  effort 


(  1  j    D1   J.  Bertillon,  Cours  élémentaire  de  statistique  administrative, 

Paris,  1895,  p.  115. 
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mathématique  considérable,  soit  que  l'on  décompose  la 
courbe  originale  en  deux  courbes  normales,  soit  que  l'on 
procède  à  une  double  sériation  conforme  à  la  loi  normale 
mais  ayant  chacune  sa  moyenne  propre  et  son  écart  pro- 
bable. Cette  analyse  nous  entraînerait  trop  loin  dans  la 
voie  des  développements  mathématiques. 

Le  cas  de  la  déviation  de  la  courbe  des  observations 
d'après  une  tendance  qui  agit  tantôt  dans  un  sens,  tantôt 
dans  un  autre,  est  intéressant.  La  synthèse  des  cas  de  dé- 
viation pour  les  courbes  unimodales  a  été  faite  par  le  Pro- 
fesseur K.  Pearson  dans  une  série  de  recherches  d'un 
grand  intérêt  scientifique.  Nous  essayerons  de  faire  saisir 
au  lecteur  la  méthode  d'après  laquelle  il  y  a  lieu  de  pro 
céder  pour  déterminer  le  type  auquel  appartient  la  courbe 
à  analyser,  et  les-  règles  à  suivre  pour  comparer  cette 
courbe  à  la  courbe  normale. 

421.  Les  courbes  unimodales  simples  se  divisent  en  cinq  ' 
types  dont  voici  les  formules  : 


Dans  cette  formule  comme  dans  les  suivantes,  œ  désigne 
les  abcisses,  y0  les  ordonnées  à  leur  origine,  y  la  hauteur 
de  l'ordonnée  placée  à  la  distance  x  à  partir  de  y0,  1  la  par- 
tie de  l'axe  des  abcisses  exprimée  en  unités  de  classes, 
a  la  base  du  système  népérien  de  logarithmes  =  2.71828. 

La  courbe  du  type  I  est  limitée  dans  les  deux  directions, 
c'est-à-dire  que  ses  deux  branches  touchent  l'axe  des  ab 
cisses  à  une  distance  finie  de  l'ordonnée  maximum,  mais 
elle  est  asymétrique. 


[. 


(98) 


I. 


y  -  y, 


m 


(99) 
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Cette  courbe  est  analogue  à  celle  du  type  I  mais  elle  est 
symétrique  dans  les  deux  directions. 

/       A p 


Le  type  III  exprime  les  courbes  qui  ne  sont  limitées  que 
dans  une  seule  direction,  c'est-à-dire  qu'une  de  leurs 
branches  atteint  l'axe  des  abcisses  à  une  distance  finie  de 
l'ordonnée  maximum,  tandis  que  l'autre  se  rapproche  in- 
définiment de  cet  axe  sans  jamais  l'atteindre;  par  l'oppo- 
sition de  la  direction  des  branches  qui  les  composent,  ces 
courbes  sont  évidemment  asymétriques. 

IV.  y  =  yg  cos  92w  tTT0,  ou  tangente  8 =  -j  (101) 

Courbe  non  limitée  dans  les  deux  directions,  comme  la 
courbe  normale  des  erreurs,  mais  asymétrique.  Les  bran- 
ches de  la  courbe  se  rapprochent  donc  de  l'axe  des  ab- 
cisses mais  sans  l'atteindre  jamais. 

V.  y  =  y0x-H~i*  (102) 
Courbe  analogue  à  celle  du  type  IV,  mais  symétrique. 

422.  Le  problème  soulevé  par  l'analyse  des  courbes  de 
fréquence  se  ramène  à  trois  points  :  il  faut,  en  premier 
lieu,  trouver  le  type  auquel  appartient  une  courbe  quel- 
conque; ensuite,  il  faut  déterminer  le  tracé  de  la  courbe 
au  moyen  de  formules  appropriées  à  chaque  cas  ;  enfin,  il 
y  a  lieu  de  comparer  les  résultats  de  l'observation  à  la 
courbe  théorique.  De  ces  trois  aspects,  le  premier  est  le 
seul  qui  puisse  être  exposé  à  des  lecteurs  qui  ne  sont  pas 
familiers  avec  les  mathématiques  supérieures  :  c'est  le  seul 
que  nous  aborderons  ici,  en  renvoyant  pour  de  plus  amples 
explications  aux  ouvrages  spéciaux,  la  matière  sortant  des 
limites  d'un  traité. 

Pour  déterminer  le  type  auquel  se  rattache  une  courbe, 
commençons  par  chercher  la  moyenne  des  grandeurs  on 


III. 


(100) 
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variables  :  adoptons  une  classe  proche  de  La  moyenne  sup 
posée  et  appelons-la  V  .  Cette  classe  servira  d'origine  et 
portera  en  regard  lo  chiffre  0.  Les  classes  situées  dans  la 
partie  supérieure  sont  numérotées  de  1  à  n,  en  partant 
de  zéro  :  ce  sont  les  classes  dont  les  variables  sont  considé- 
rées comme  négatives.  Celles  qui  sont  situées  dans  la  par- 
tie inférieure  sont  de  même  numérotées  de  1  à  n,  en  partant 
de  zéro  :  ce  sont  les  classes  à  variables  positives.  Les  chif- 
fres des  classes  sont  inscrits  dans  la  seconde  colonne  inti- 
tulée V  —  V„ ,  Y  étant  l'indication  de  la  classe  (première 
colonne).  Dans  la  troisième  colonne  nous  transcrivons  les 
fréquences  dans  l'ordre  de  leurs  classes  respectives  et 
nous  en  faisons  le  total.  Nous  multiplions-  les  fréquences 
par  V  —  V0  et  nous  inscrivons  les  produits  dans  une  qua- 
trième colonne  intitulée  /  (V  —  V0)  ;  nous  faisons  la  somme 
algébrique  des  quantités  positives  et  négatives.  La  cin- 
quième colonne  est  formée  des  carrés  de  V  —  V„  multi- 
pliant les  fréquences  de  la  classe  correspondante,  ou  bien 
encore  en  multipliant  les  premiers  produits  obtenus  par 
V  —  V0.  La  somme  algébrique  de  ces  produits-  est  de  nou- 
veau faite,  puis  divisée  par  n;  le  quotient  est  appelé  v,, 
d'après  la  formule  : 

v>  =  '-  (103) 

On  procède  de  même  pour  les  troisième  et  quatrième 
puissances  des  nombres  considérés.  Les  formules-  : 

v,  =    "(V~  V")!i    (104)  v4  =  Ï(V~  Vo)4  (105) 

//  ii 

expriment  les  mêmes  opérations  que  dans  les  formules 
précédentes,  sauf  la  puissance  à  laquelle  les  nombres  sont 
élevés. 

Les  formules  ci-dessus  sont  appliquées  dans  l'exemple 
suivant  à  la  série  du  Pimpinella  Saxifraga  L  que  nous 
avons  déjà  utilisée  à  plusieurs  reprises. 
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Pimpiuella  saxifraga  L.f  0 


1 

2 

3 

4 

5 

6 

7 

V 

V  —  V0 

T 

f(v-  v0)  AV-v0p 

f(V—  V0)3 

f(y—vg)* 

5 

—  5 

1 

- 

- —  5 

25' 

-  125 

625 

6 

—  4 

—  20 

80 

—  320 

1280 

7 

—  3 

9 

—  27 

81 

—  243 

729 

8 

—  2 

22 

—  44 

88 

—  176 

352 

9 

—  1 

38 

—  38 

38  . 

—  38 

'•.  38 

10 

0 

62 

-  134 

—  902 

11 

1 

61 

61 

61 

61 

61 

12 

2 

29 

58 

116 

232 

464 

13 

3 

14 

42 

126 

378 

1134 

14 

4 

4 

16 

64 

256 

1024 

15 

5 

4 

20 

100 

500 

2500 

197 

779 

1427 

8207 

4-  63 

+  525 

2  (V  —  V0  )  =  —  134  +   197  =  +  63 

2  (V  —  Vo  )*  =  779 

2  (V  —  V0  )8  =  _  902  +  1427  =  +  525 

2  (V  —  Vo  )4  =  8207. 


Les  totaux  des  colonnes  4  à  7  sont  divisés  par  le  nom- 
bre des  observations  et  les  quotients  obtenus  sont  les  mo- 
ments autour  de  10. 


(1)  Cfr.  W.  Palin  Eldebton,  Frequency-ourves  and  corrélation,  p.  16 
C.  B.  Davenport  :  Statistical  methods. 
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D'après  les  formules  : 


X  (Y 

- 

Vo) 

+  63 

?/ 

ZI.  ' 

2(V 

Vo  )2 

77«.l 

n 

24y 

S(V 

Vo  )3 

+  o25 

n 

249 

3(V 

v-  )< 

S207 

249 


-j  .253 

3.428 

-j-  2.108 
32.95*» 


Les  expressions  ci-dessus  sont  appelées  «  moments  »  de 
la  courbe. 

Il  faut  maintenant  déterminer  la  place  des  moments  au- 
tour de  la  moyenne. 

Deux  méthodes  sont  applicables.  La  première  est  celle 
à  employer  quand  il  s'agit  de  variables  qui,  d'après  leur 
nature,  sont  exprimées  en  nombres  entiers,  par  comptage. 
C'est  le  cas  des  caractères  de  variabilité  du  Pimpinella 
saxifraga  L.  que  nous  avons  pris  pour  exemple.  Les  for- 
mules applicables  à  cette  recherche  sont  les  suivantes  : 


Mi 

=  0 

(106-H1) 

M2 

=  v2 

-  v/ 

M:; 

-  v3 

—  3ViV2 

f  2Vls 

=  v4 

—  4v4v3 

-f  6vj2v2  - 

-  3v^ 

Ms 

=  v5 

—  5ViV4 

+  10Vl2v:, 

—  lOv^Vs 

+  4vt5 

Me 

=  v6 

—  6V!V3 

+  15v,2v, 

—  20^ 

Ces  formules  s'écrivent  également  en  remplaçant  V[par 
d;  lorsque  le  calcul  des  moments  se  fait  autour  de  la  verti- 
cale centrale,  comme  dans  le  tableau  ci-dessus,  la  valeur 
de  d  est  la  même  que  v,  (1). 


(1)  Cfr.  W.   Palin  Et.derton,  Frequ-enry-curves  and  corrélation,  p.  18. 
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Appliquons  les  formules  : 

H2  -  3.128  —  (  +  .2S3)2  =  3.128  —  0.064009  =  3.063991 

|U3  =  2.108  —  3(.253  x  3. 128)  +  2(.253,3 

=  2.108  —  2.374152   h  .32388554  =  .057733 

M4  =  32.959  —  4(.253  x  2.108)  +  6(  .064009  x  3.128) 

—  3(  .04097152081)  = 

32.959  —  4(  .533324)     6(  .200220152) 

-  3(  .04097152081)  = 

32.959  —  2.133296-1-  1.201320912—  .12291456243 
=  31.9041102877. 

Le  travail  arithmétique  ci-dessus  peut  être  remplacé  par 
l'usage  des  logarithmes. 

Davenport  en  a  donné  un  exemple  détaillé  auquel  nous 
renvoyons  le  lecteur  (1). 

423.  La  méthode  qui  vient  d'être  indiquée  est  à  la  fois 
la  plus  directe  et  la  mieux  appropriée  pour  déterminer 
les  moments  ;  toutefois,  il  en  est  une  autre  qui  a  été  indi- 
quée et  employée  par  un  actuaire  anglais,  M.  G.  F.  Har- 
dy (2).  Le  mode  de  calcul  usité  dans  cette  méthode  est  le 
même  que  celui  des  «  pourcentages  accumulés  »  dont  on 
se  sert  fréquemment  dans  les  statistiques  de  salaires  (3). 
Le  premier  moment  est  connu  en  additionnant  les  «  pour- 
centages accumulés  »  des  fréquences  (X  /  (n)  =  V0),  et 
le  second  moment  en  additionnant  de  même  les  pourcen- 
tages du  premier  moment. 

Dans  la  notation  spéciale  usitée,  S2  désigne  le  second 
moment;  S3  donne'  chaque  fonction  multipliée  par  des 

coefficients  de  la  forme  11  (n  +D  ou  n"  +  n  ■ 

2  2 

S3  =  H!)  +  3/(2)  +  6/(2)  -f  +  7L1+Af  (n)  (112) 

(1:  Cfr.  B.  Davenport.  Ktatislical  methods,  p.  36. 

(2)  Référence  à  M.  G.  F.  Hardy,  dans  W.  Palin  Elderton,  Frequency 
curves  and  corrélation,  p.  19. 

(3)  Voyez  sur  cette  méthode  :  A.  Julin,  Précis  du  cours  de  statistique 
générale  et  appliquée,  3"  édition,  Bruxelles,  Miseh  et  Thron.  1  il  1 2.  p.  71. 
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ce  qui  donne  vi  expression  dans  laquelle  v  est  écrit 

pour  le  moment  parce  que  par  définition  le  tm*  momenl 
(vt)  de  La  distribution  entière  est  donné  par  la  somme  de 
fC  f  (n)  pour  toutes  les  valeurs  de  n.  Enfin  S,  et  Sr>  don- 
nent chacun  une  fonction  multipliée  par         '^f     ""  ei 

<> 

n*  +  6  »3  +U_n*  ±  6  »  respectivement  (1). 
Nous  avons  donc  les  opérations  ci-après  : 

52  =  Vj 

53  =  i  (v2  -f  vO 

s4  =  i  (v3  4-  3v2  +  2v,) 


S5  =  s-,  (v4  +  6v3  +        +  6V 


Telles  sont  les  équations  qui  permettent  de  calculer  les 
moments  autour  d'une  origine  choisie,  mais  s'il  convient 
de  rechercher  les  moments  autour  de  la  moyenne,  les  ex- 
pressions ci-après  sont  préférables  : 

v,  =  2  S3  —  d  (1  +  d) 

v3  =  6  S4  —  3  v,  (1  -h  d)  —  <l([  +  d)  (2  +  d) 

v4  =  24  S5  -  2  v3  |  2  (  I  -|-  d)  |-  1  !  —  v2  J  6  (4  +  à)  (2  +  d)  -  1  j 

—  d  (1  -h  d)  (2  -h  d)  (3  -f 

424.  Lorsqu'il  s'agit  de  séries  disposées  de  façon  à  cal- 
culer la  moyenne  par  le  procédé  ordinaire,  la  suite  des  cal- 
culs, dans  la  méthode  de  M.  Hardy,  se  dispose  de  la  ma- 
nière suivante  :  1°  les  nombres  bruts  de  la  série  sont  rap- 
portés à  leur  somme,  prise  pour  l 'unité  ;  il  est  recommandé 
de  pousser  les  calculs  au  moins  jusqu'à  la  troisième  déci- 
male; les  nombres  proportionnels  rangés  dans  leur  ordre 
forment  la  première  colonne  du  tableau;  2°  la  seconde  co- 


(1)  Cfr.  W.  Palin  Eldebton,  loc.  cit.,  p.  21 
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lonne  forme  le  résultat,  S2;  le  dernier  nombre  de  la  pre- 
mière colonne  est  inscrit  au  bas  de  la  seconde  ;  on  y  ajoute 
Pavant-dernier  de  la  première  colonne  et  ôn  inscrit  ce  ré- 
sultat dans  la  seconde  immédiatement  au-dessus  du  nom- 
bre inscrit  précédemment,  et  ainsi  de  suite;  le  dernier 
nombre  inscrit  au-dessus  de  la  colonne  doit  former  l'unité 
suivie  de  ses  parties  décimales;  enfin,  on  fait  la  somme 
de  tous  les  nombres  de  la  colonne  :  cette  somme  =  S2  ;  ajou- 
tée à  une  valeur  arbitraire  prise  comme  origine,  et  multi- 
pliée par  l'intervalle  de  classe  elle  forme  la  moyenne;  3°  on 
procède  de  même  pour  la  troisième,  la  quatrième,  la  cin- 
quième colonne  en  utilisant  toujours  les  données  inscrites 
dans  la  colonne  précédente;  les  sommes  obtenues  corres- 
pondent à  S3,  S4,  S5,  respectivement. 

Le  procédé  est  différent  si  l'on  emploie  la  méthode  indi- 
recte pour  trouver  la  moyenne.  Dans  ce  système,  certaines 
quantités  sont  négatives,  d'autres  positives  :  les  moments, 
pour  les  termes  appartenant  à  la  partie  négative,  sont  for- 
més par  multiplication  des  pouvoirs  des  quantités  néga- 
tives. Si  m  est  une  valeur  négative,  la  formule  I  nf  (n) 
devient  I  —  nf  ( —  n)  et  la  formule 


11  {n  +  1) 


f(n)  se  change  en  v 


,  —  M —  n  +  1) 


/  (-  n) 


5 


2 


ou 


v  n(n  —  1) 

2~ 


f(-  n)  ; 


(113) 


de  même  nous  avons  : 


v 


—  n(—  tt  +  l)(—  n  +  2) 
6 


/'(-«) 


ou 


2  m  (w  —  1)  (n  —  2) 
6 


fi-  n); 


(114) 


enfin  nous  avons  : 
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L'exemple  suivant  reprend  les  données  utilisées  précé- 
demment au  n°  422. 


Fréquences 

Première 
somme 

Deuxième 
somme 

Troisième 
somme 

Quatrièn.e 
somme 

Cinquième 
'  somme 

Sixième 
somme 

4 

4 

4 

4 

4 

4 

4 

20 

24 

28 

32 

36 

40 

36 

60 

88 

120 

156 

89 

149 

237 

357 

152 

301 

538 

249 

245 

450 

791 

1332 

2153 

3350 

5035 

117 

205 

341 

541 

821 

1197 

56 

88 

136 

200 

280 

376 

16 

32 

48 

64 

80 

96 

16 

16 

16 

16 

16 

16 

52  =-   .791  —   .538  =  .253 

53  =  1.332  -f   .357  =  1.689 

54  =  2.153  —  .156=1.997 

55  p_  3.350  4-   .040  =  3.390 

56  =  5.035  —   .004  =  5.031 

Or  v2  =  2S:?  -  .1  (1  +  d), 

soit  dans  l'exemple  numérique 

2x1.689—  . 253 x 1.253  =  3.063991  etc. 

425.  Pearson  a  démontré  que  la  classification  de 
tout  polygone  de  fréquence  obtenu  par  l'observation  dé- 
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pend  de  la  valeur  de  ce  qu'il  appelle  sa  «  fonction  cri- 
tique »  F  (critical  function).  Or 


P^Pa  +  3)2 

4  (4P,  -  3p,)  (2p,  -  3pt  -  6)  (116) 


Or, 


2 

o  M3    .  o  ^4 


Déterminons  ces  valeurs 


d'où 


et 


ou 


,^2  =  (.057733)2  ==  .003333099289 

^3  =  (3.063991  )3  ==  28.764873 

M4  =31.904140 

M22    -  (3.063991)2  =  9.388041 

.003333  _  31.904110 

28.764873'        P'2  9.388041 


Pj  =  .000115870;       p,  =  3.398377 


F  = 


Pi(Pî-f  3)* 


4(4p,-3pJ)(2p2-3p1-6j 


.000115870  x  (40.939253) 
4(13.593161390)  (.796406390) 

.00474363^4»  _  v 


41.302699917464 

Or,  si  F  >  0  et  <  1,  on  a  une  courbe  du  type  IV,  ce  qui 
est  ici  le  cas. 

La  courbe  du  Pimpinella  Saxifragà  L.  est  donc  du 
type  IV,  qui  est  le  type  habituel  des  courbes  des  phéno- 
mènes biologiques. 
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426'.  Si  l'on  veut  comparer  le  polygone  observé  avec  le 
polygone  théorique  afin  de  déterminer  le  degré  d'exacti- 
tude avec  lequel  le  premier  suit  la  courbe  du  second,  on 
fera  la  différence  entre  la  valeur  théorique  des  fréquences 
de  chaque  classe  et  sa  valeur  observée;  on  porte  ensuite 
ces  différences  au  carré  et  on  divise  leur  somme  par  la  va- 
leur  théorique  :  la  racine  carrée  du  quotient  constitue 
dice  d'exactitude  cherché.  La  foi-mule 


in 


(117) 


dans  laquelle  b  représente  les  différences  et  y  la  valeur 
théorique  donne  la  valeur  du  coefficient,  qui  est  souvent 
désigné  par  la  lettre  A  (K.  Pearson.) 

427.  Lorsqu'il  s'agit  de  variables  dont  les  classes  sont 
exprimées  par  des  chiffres  limites,  par  exemple  des  sa- 
laires compris  entre  telle  somme  et  telle  autre,  les  mo- 
ments de  la  courbe  se  déterminent  à  l'aide  d'une  formule 
différente  de  la  première. 

Soient  connues  les  valeurs  de  vn  v,,  v3,  v, ,  les  valeurs 
de  |u  s'obtiennent  au  moyen  des  formules  suivantes  : 


M':  =  0 

M  2  =     v2  —  v. 


U3 


\"1 


3  v,  v-> 


x2; 


2  v,»  X3; 


#4  =  1  v',  — iv,  V.:  4-6  v,-  V-, 


3v,< 


(118) 
119 

(120) 

ï(yi-V)  +  |j5]*4;(«i) 


H'5-  j  V,—  5  v,v4  +  10  v,  2v:î  — I0v,  3v2  -f  iv,5  —  g  fi3  j  X,  ;  122» 


dans  ces  expressions,  X  est  l'intervalle  de  classe  exprimé 
dans  l'unité  de  la  moyenne. 
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428.  Les  caractères  distinctifs  des  courbes  de  Pearson 
se  révèlent  au  moyen  de  la  valeur  de  la  fonction  critique  F. 

Pour  la  courbe     I,  nous  avons  F  <  0 

»  IT,        »  F  —  0,  Pi  =  0,  p2  n'égale  pas  3  ; 

»  Ilf,        »  F  =  oo 

»  IV,        »  F  >  0  et  <  1 

»  V;       »  F  =  i. 

V.  —  Quelques  déterminations  d'erreurs  probables. 

429.  Les  formules  suivantes  permettront  de  rechercher 
l'erreur  probable  de  quelques  mesures  importantes  em- 
ployées en  statistique. 

Erreur  probable  de  la  moyenne.  —  La  mesure  à  laquelle 
le  professeur  Pearson  a  donné  le  nom  de  «  Standard  dé- 
viation »  dérive  évidemment  de  la  théorie  des  erreurs 
d'observation  :  c'est  à  raison  de  ce  caractère  qu'elle  a  été 
nommée  «  erreur  moyenne  »  par  G-auss,  «  error  of  mean 
square  »  par  Airy  et  quelquefois  «  mean  square  error  ». 
Nous  rappelons  sa  formule 


{x*)  (  28 


La  «  Standard  déviation  »  est  un  des  éléments  princi- 
paux de  la  formule  de  l'erreur  probable  de  la  moyenne  : 
celle-ci  est  en  effet  connue  si  l'on  multiplie  la  constante 
0.6745  par  la  «  Standard  déviation  »  divisée  elle-même  par 
la  racine  carrée  du  nombre  de  variables.  La  formule,  en 
effet,  est  la  suivante  : 

±  0.6745  -/=  (123) 

Appliquons  la  formule  à  un  exemple  numérique  : 

Dans  l'observation  de  la  «  pimpinella  Saxifraga  L.  » 

la  Standard  déviation  cr  =  1.461.  Le  nombre  n  =  249; 

|/249=  15.7797338.  De  là,  on  a  : 

±  0.6745.  -LM.  =  0,06239125. 
15.780 
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L 'erreur>môyenne  est  d'autant  plus  petite  que  le  nom- 
bre des  variables  est  plus  grand;  cependant  son  exactitude 
n'augmente  pas  comme  le  nombre  des  variables,  mais  seu- 
lement dans  la  proportion  de  la  racine  carrée  de  ce 
nombre. 

430.  Erreur  probable  de  la  médiane.  —  La  Standard 
déviation  d'un  percentile  correspondant  à  une  proportion 
p  (  )  est  connue  par  la  formule 


Dans  le  cas  d'une  distribution  analogue  à  celle  de  la 
courbe  normale,  les  valeurs  de  yp  sont  données  directement 
par  des  tables  dressées  par  M.  Slieppard,  d'après  les- 
quelles cette  valeur  est  pour 

la  médiane  =  0.3989423 

Après  l'insertion  de  la  constant^  0.3989423  dans  l'équa- 
tion ci-dessus,  on  tire  la  constante  0.84535. 

De  là,  la  formule 

+  0.8'k>35 

V» 

431.  Erreur  probable  de  la  Standard  déviation.  —  L'ex- 
pression générale  de  l'erreur  probable  de  la  Standard  dé- 
viation dans  le  cas  d'une  distribution  de  n'importe  quelle 
forme  est  : 


1/ 


^7  ^  (I)  (125) 


Mais  dans  le  cas  d'une  distribution  normale,  la  formule 
est  la  suivante  : 

+  0.6745  r?=-  (126) 
-  [/  In 


(1)  G.  U.  Yule,  An  introduction  to  the  theory  of  statistics,  p.  347. 
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Appliquons  la  seconde  formule  à  l'exemple  numérique 
calculé  au  n°  422.  Nous  avons  : 

a     52.2         n  -  2.41)         ^/2n"=  22.3159136 

±  0.6745  tj=  =  1  .5776555 
y  tn 

432.  Erreur  probable  du  coefficient  de  corrélation  ou 
de  covariation  r  (1). 

Pour  trouver  l'erreur  probable  du  coefficient  de  corré- 
lation, il  faut  porter  au  carré  le  coefficient  de  corrélation 
et  le  soustraire  de  l 'unité  puis  diviser  le  reste  par  la  racine 
carrée  du  nombre  de  variables,  le  tout  étant  multiplié  par 
la  constante  0.6745.  La  formule  s'écrit  : 

(1  —  r2) 

0.6745  ii— L±  (127) 
y  n 

Le  coefficient  de  corrélation  entre  les  indices  de  la  pro- 
duction et  ceux  des  échanges  en  Belgique,  entre  les  années 
1880  et  1908  est  0.982. 

Nous  avons 

=  0.964324 
1  _  ?-2  =  0.035676 
h  =  29;    J/29  =  5.3851648 

14         r2\     a  03S67fi 

0.6745  -l       '  '.  =  i ,  •"  k  "  . "  -  0.6745  X  0.006604  =  0.0044543980 
o. 3851 648  / 

433.  Erreur  probable  du  coefficient  de  régression.  — 
Pour  trouver  l'erreur  probable  du  coefficient  de  régres- 
sion on  a  recours  à  la  formule  : 


0.6745  .  l  (128) 

(T2  [/  n 

dans  laquelle  la  dernière  expression  peut  être  remplacée 
par  celle-ci  : 

a  1.2 

—r  (129) 
a [/  n 


(1)  Cfr.  W.  Palin  Elderton,  Frequency-curves  and  corrélation,, 
pp.  136-138. 
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désignés  (99);  des  relations  entre  le  relevé  partiel  et  le  relevé 
complet  (JOOj. 

II.  La  monographie.  —  La  monographie  est  une  annexe  de  la  statistique, 

mais  ne  se  confond  pas  avec  elle  (101)  ;  références  sur  le  relevé  direct 
et  indirect  (102). 


Section  III.  —  La  critique  statistique. 
Chapitre  premier.  —  Généralités,  définition,  division. 

I.  heyré  de  précision  des  résultats  statistiques.  —  Les  limites  de  la 
précision  dans  les  sciences  (103):  les  limites  de  la  précision  dans  les 
recherches  statistiques;  le  résultat  du  relevé  statistique  n'est  qu'une 
approximation  (104)  ;  objection  :  un  examen  critique  et  des  correc- 
tions sont-ils  bien  nécessaires?  Réponse  (105). 
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II.  Influence  de  la  centralisation  sur  l'exactitude  des  résultats.  les 
deux  systèmes  en  présence.  Absence  de  critique  dans  le  système 
décentralisé;  tout  repose  sur  l'agent  recenseur  (106). 

III.  Nécessite  de  l<t  critique  statistique.  —  Le  chiffre  fascinateur  107  ; 
l'examen  <in  document  esi  indispensable  en  statistique  comme  en 
histoire  (108);  première  notion  îles  erreurs  constantes  e1  acciden- 
telles (100);  division  de  la  matière  (110). 


Chapitre  II.  —  Critique  de  sincérité 

Mobiles  psychologiques  influençant  lu  sincérité  statistique  —  Distinction 
entre  erreurs  constantes  et  erreurs  fortuites  (111);  influence  delà 
crainte;  crainte  des  mesures  fiscales  et  de  réglementation  (112) ; 
inox  eus  pour  atténuer  celte  cause  d'erreurs  (115);  mesures  spéciales 
pour  corriger  des  erreurs  constantes  il  11):  craintes  de  désavantages 
d'ordre  moral  (115);  paresse,  négligence,  mauvaise  volonté  des 
recensés  et  des  agents  recenseurs  (116);  le  statisticien  et  sa  respon- 
sabilité scientifique  (1 17). 


Chapitre  III.  —  Critique  d'exactitude. 

En  quoi  consiste  la  critique  d'exactitude  (118'. 

I.  Vérification  interne.  —  Recherche  des  lacunes  de  la  statistique;  m<>\  ens 
de  les  constater  (119);  utilité  des  comparaisons  (120)  ;  recherche  îles 
multiples  emplois;  exemples  (121);  recherche  tics  erreurs  involon- 
taires, contradictions,  etc.  ;  l'auteur  du  document  a-t-il  répondu  ?  (122)  ; 
l'auteur  du  document  a-t-il  compris?  (125);  rôle  des  questions  de 
contrôle  (121):  procédés  de  revision;  exemples  (125). 

II.  Vérification  externe  (126). 


Chapitre  IV.  —  Précision  des  résultats 

Règle  de  la  recherche  de  la  précision  [f'orni.  4)  (127);  difficulté  résultant  de 
l'absence,  dans  les  recherches  statistiques,  de  mesures  types  (128); 
exemples  de  comparaison  à  des  mesures  plus  exactes  (129)  ;  pourquoi 
ces  cas  sont  rares  (150)  ;  comparaison  entre  plusieurs  mesures  151  : 
etlét  de  plusieurs  erreurs  dans  les  additions  et  les  moyennes 
[j'orm  5)  (1 52)  ;  simplification  dés  nombres  cités;  règles  (135)  ;  réfé- 
rencés sur  la  critique  statistique  131). 
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Section  IV. 

Le  dépouillement  et  la  présentation  des  données  statistiques. 

Chapitre  premier.  —  Préparation  du  relevé. 

I.  Généralités  et  division  de  lu  matière.  —  Processus  du  dépouillement 

(155j;  le  dépouillement  prépare  le  travail  scientifique  statistique  (136); 
à  quelles  données  s'étend  le  dépouillement  (137). 

II.  Conditions  générales  du  dépouillement.  —  11  ne  peut  s'écarter  trop  du 

matériel  original  (138)  ;  le  cadre  statistique  (139);  exemples  (140;  ; 
formation  des  classes  dans  un  groupement  statistique  (141)  ;  exemple 
numérique  (142)  ;  formules  (143)  {for m  6-7)  ;  utilisation  dans  le  calcul 
des  probabilités  (144);  exemples  de  tableaux  de  complexité  crois- 
sante (145);  nombre  de  combinaisons  possibles  entre  données  statis- 
tiques (146). 

III.  Des  classifications  statistiques.  —  Importance  des  classifications  (147)  ; 

chaque  espèce  de  statistique  a  son  principe  de  classification  (148); 
inconvénients  des  classifications  trop  brèves  ou  trop  étendues  (ti9); 
danger  d'utiliser  certains  principes  de  la  classification  générale  des 
sciences  ( ISO) ;  des  nomenclatures  alphabétiques  (loi);  classifications 
homogènes  et  hétérogènes  (152);  du  groupement  des  faits  sta- 
tistiques dans  les  cadres  (153)  ;  précision  des  divisions  (154);  point 
de  départ  des  divisions  (155). 

IV.  Préparation  des  tableaux.  —  Relations  logiques  entre  les  divisions  des 

tableaux  à  double  entrée;  exemple  (156). 

Chapitre  II.  —  Exécution  du  dépouillement. 

I.  Organisation  du  dépouillement.  —  Méthodes  générales  :  décentralisa- 
tion, centralisation  (157);  avantages  de  la  méthode  centralisatrice 
(158);  objections  faites  à  cette  méthode  (159). 

II.  Méthodes  de  dépouillement.  —  Méthode  de  dépouillement  par  pointage 

(160);  ses  désavantages  (161)  ;  dépouillement  par  fiches  (162);  utilisa- 
tion de  ce  procédé  (163);  modèles  de  fiches  (164);  avantages  des 
fiches  (165). 

Chapitre  III.  —  Le  dépouillement  statistique  et  le  calcul 
par  les  machines. 

I.  Machines  a  dépouiller.  —  Nécessité  dans  les  grandes  opérations  de  sim- 
plifier le  travail  (166);  machine  électrique  de  M.  Hollerith;  la  fiche 
(167):  le  Key-Puneh  (fig.  1)  (168);  le  GangPunch  (fig.  2)  (169);  la 
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machine  à  classer  ((if)  3)  (170,:  la  machine  à  dépouiller  (/«</•  t,  5,  S) 
(171)  ;  perfectionnements  nouveaux  (172);  classi-compteur  imprimeur 
de  M.  March  (fig.  7)  (173). 

II.  Machines  à  calculer.  —  Pr  emiers  essais  (1 74)  ;  arithmographe  froiiche! 
(fig.  8)  (175);  additionneur  Roth  (fig.  9)  (176);  machines  à  addition- 
ner,  à  louches  (fig.  10  à  12)(ill);  multiplication  par  additions  succes- 
sives, soustraction  par  l'emploi  des  nombres  complémentaires  178); 
machines  à  multiplier  (fig.  13)  (179):  rouleau  diviseur  (fig.  14)  (480). 

III.  Avantages  des  machines  (181). 

Chapitre  IV.  —  La  présentation  des  résultats  statistiques. 

1.  Règles  pratiques  de  la  présentation  statistique  (182)  ;  remarques  sur  la 
forme  matérielle  de  la  présentation  (183)  ;  références  sur  le  dépouille- 
ment et  la  présentation  f!84). 


LIVRE  SECOND 
Procédés  d'analyse  du  matériel  statistique. 
Généralités  et  division  de  la  matière. 

Le  travail  de  mise  en  œuvre  et  d'analyse  succède  au  récolement  et  au  clas- 
sement (185).  La  classification  des  opérations  se  base  sur  leur  ordre 
logique  et  non  sur  leur  caractère  mathématique  (186). 

Chapitre  premier.  —  Séries,  sériation,  distribution 

l.  Les  séries  statistiques.  —  Une  succession  de  données  forme  une  série: 
les  phénomènes  sont  observés  selon  les  divisions  du  temps,  de 
l'espace  ou  en  eux-mêmes;  classement  de  séries  (187).  Séries  basées 
sur  une  mesure  du  temps  :  l'année,  le  semestre,  le  mois;  exemples 
(188)  ;  les  divisions  peuvent  être  plus  courtes  :  la  journée,  l'heure; 
définition  de  l'échelle  de  la  série;  exemples  (189-190).  Séries  basées 
sur  les  divisions  de  l'espace;  ce  classement  n'échappe  pas  à  tout 
arbitraire,  mais  il  a  aussi  ses  avantages  ;  exemple  (191).  Etude  des 
distributions,  troisième  modalité  des  séries,  exemple  (192).  Autre 
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proposition  de  classement  :  séries  à  caractère  constant,  séries  dyna- 
miques régulières,  irrégulières,  exemples  (195-195). 

H.  Sériation.  —  Détinition  et  but  de  la  sériation.  Définition  des  termes  : 
classe,  grandeur  de  la  classe,  fréquence,  distribution  des  fréquences, 
module  (196).  Le  but  qu'on  se  propose  domine  la  nature  de  la  séria- 
tion; types  de  sériation,  exemples  (197).  On  peut  sérier  par  pour 
cent  au  lieu  d'opérer  sur  les  nombres  absolus;  exemples  (198);  la 
précision  de  la  sériation  dépend  de  celle  du  relevé  et  du  dépouille- 
ment (499). 

III.  Distribution  des  fréquences.  —  La  sériation  comprend  l'étude  des 
mouvements,  de  l'allure  des  phénomènes  (200)  ;  notions  préliminaires 
sur  les  graphiques  ;  le  polygone  de  fréquence  et  l'histogramme  (201)  ; 
hypothèse  sur  la  ressemblance  de  ces  courbes  avec  la  courbe 
normale  des  erreurs;  hypothèse  de  Gauss  et  de  Quetelet;  usage,  du 
triangle  arithmétique  (202);  la  loi  générale  de  distribution  diffère  de 
la  courbe  normale;  cependant  certaines  distributions  s'en  rappro- 
chent; exemple  (fi g.  lô)  (2l'3);  un  grand  nombre  de  distributions 
s'écartent  légèrement  de  la  normale;  différentes  méthodes  d'identifi- 
cation (204);  méthode  de  reconstitution  de  Fecbner  (205);  classifi- 
cation générale  des  courbes  asymétriques  du  professeur  K.  Pearson 
(206)  ;  exemples  de,  courbes  légèrement  asymétriques  (fig.  16,  17 
et  1H)  (207);  formes  de  distribution  entièrement  asymétriques: 
exemple  (fia.  19)  i208)  ;  formes  de  distribution  asymétriques  en  U; 
exemple  (fig.  20)  (209)  ;  conclusion  (210);  références  (211). 


Chapitre  II.  —  Moyennes,  médiane,  dominante. 

I.  Définitions,  classification,  espèces  de  moyennes. —  Rôle  synthétique  de 
la  moyenne  (212).  Caractère  mathématique  de  la  moyenne;  défi- 
nition de  la  moyenne  (213).  Qualités  que  doivent  réunir  les  moyennes 
(214);  résumé  (215). Deux  espèces  de  moyenne  :  objective  et  subjective. 
Kn  quoi  consiste  la  moyenne  objective  (216).  La  moyenne  subjective  ; 
définition  ;  sa  fréquence  en  statistique  (217).  Les  deux  espèces  de 
moyennes  dillèrent  substantiellement  (218 i.  Les  séries  se  rapportant 
à  plusieurs  objets  homogènes  engendrent  des  courbes  asymétriques  ; 
application  de  la  moyenne  aux  phénomènes  biologiques  et  botaniques  ; 
exemples  (fig.  21-22)  (219).  Classification  des  moyennes  basée  sur 
la  manière  de  les  calculer  (220);  moyenne  arithmétique  simple  et 
composée;  (form.  8  à  11)  ;  moyenne  géométrique  (form.  12  à  14); 
moyenne  harmonique  Iform.  15-16);  moyenne  contre-harmonique 
(form.  Il);  moyenne  quadratique  (form.  18)  (221)  ;  application  des 
formules  (222)  ;  classement  proposé  par  Kechner  (form.  19)  (223). 
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il.  La  moyenne  arithmétique.  —  La  moyenne  simple  et  la  moyenne  pon 
dérce  sont  des  expressions  de  la  moyenne  arithmétique  :  fondement 
de  la  règle  de  la  moyenne  arithmétique  (221)  ;  calcul  de  la  moyenne 
arithmétique  simple  ;  exemple  (225)  ;  calcul  de  la  moyenne  arithmé- 
tique composée  ;  exemple  (226)  :  calcul  dans  le  cas  où  chaque  «  lasse 
est  comprise  entre  des  chiffres-limites;  exemples  (227-228)  ;  autre 
méthode  pour  le  calcul  de  la  moyenne  form.  20-2i)\  règle  pour 
la  moyenne  arithmétique  simple  ;  exemple  (229)  ;  règle  pour  la 
moyenne  arithmétique  composée  ;  exemples;  avantages  du  procédé 
indirect  (250  251)  ;  règle  pour  le  calcul  basé  sur  des  données  propor- 
tionnelles ;  exemple  (252)  ;  conditions  intrinsèques  du  calcul  de 
la  moyenne  dans  les  séries  régulières  (255)  ;  caractère  de  la  moyenne 
dans  les  séries  exprimées  par  une  courbe  asymétrique  (25-4)  ;  la 
moyenne  ne  peut  se  calculer  que  sur  des  données  homogènes  quant 
à  leur  nature,  à  l'époque  et  au  lieu  du  récolement  (235)  :  conditions 
d'homogénéité  dans  une  statistique  des  salaires  (256). 

III.  La  moyenne  géométrique.  —  Définition  et  règle  (v257)  ;  application 

de  la  règle;  exemple  (258);  principaux  cas  d'application  de  la 
moyenne  géométrique  (259)  ;  si  les  données  ne  sont  pas  fort  dissem- 
blables, les  résultats  restent  inchangés,  que  l'on  emploie  la  moyenne 
géométrique  ou  arithmétique  (240)  :  application,  exemple  (241)  ; 
il  en  est  de  même  des  séries  dynamiques  dont  les  données  progressent 
d'une  façon  sensiblement  égale  (242). 

IV.  La  moyenne  harmonique.  —  Définition,  rappel  des  formules,  position 

par  rapport  aux  moyennes  arithmétique  et  géométrique  (245)  ; 
principaux  cas  dans  lesquels  l'emploi  de  cette  moyenne  est  recom- 
mandé (244). 

V.  Principales  propriétés  mathématiques  des  moyennes.  —  Moyenne 

arithmétique  ;  quelques-unes  de  ses  caractéristiques  (245);  première 
propriété  mathématique  de  la  moyenne  (form.  22-24),  démonstration, 
application  (246)  ;  deuxième  propriété  mathématique  de  la  moyenne, 
démonstration  (247);  autre  démonstration  (248);  application; 
notion  de  la  fluctuation  (form.  25)  (249)  ;  troisième  propriété  mathé- 
matique de  la  moyenne  (250)  ;  deux  propriétés  de  la  fluctuation  ; 
applications  (251)  ;  moyenne  géométrique  :  première  propriété 
mathématique,  démonstration,  application  (252);  seconde  et  troisième 
propriétés  mathématiques  de  la  moyenne  géométrique;  démonstra- 
tion (255-254);  rapports  îles  moyennes  arithmétique,  géométrique,  et 
harmonique  ;  exemples  (255'. 

VI.  La  médiane.  —  Définition,  procédé  de   calcul    (256)  ;  application 

pour  le  cas  d'une  série  formée  de  données  comprises  entre  des 
chiffres  limites  (257);  nature  scientifique  de  la  médiane;  application 
aux  recherches  des  sciences  naturelles  (258);  expérience  des  quatre- 
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vingt-quatorze  amandes  (fïg.23)  (259)  ;  les  résultats  sont-ils  modifiés 
par  l'introduction  du  hasard?  exemple  {fiq.  24)  (260);  nouvelle 
application  d'après  le  même  principe  :  exemple  ifig.  25)  (261)  ;  condi- 
tions de  calcul:  deux  séries  partielles  combinées  donnent  le  résultat 
de  la  série  complète  en  ce  qui  concerne  la  moyenne,  non  en  ce  qui 
regarde  la  médiane  (262);  pour  calculer  la  médiane,  il  faut  disposer 
des  données  individuelles  ;  la  médiane  ne  s'applique  pas  aux  séries 
formées  de  nombres  proportionnels  ou  de  moyennes  (263)  ;  avantages 
de  la  médiane  (264)  ;  inconvénients  (265). 

VU.  La  dominante  {mode).  —  Définition,  discussion  du  terme  mode, 
rapport  de  la  dominante,  de  la  moyenne  et  de  la  médiane  dans  une 
courbe  normale  et  dans  une  courbe  asymétrique  (266);  en  quoi  la 
dominante  diffère  de  la  moyenne  (267)  ;  avantages  de  la  dominante 
(268)  :  procédés  peur  déterminer  l'emplacement  de  la  dominante  ; 
première  méthode  de  M.  Bowley  (269)  ;  application  de  la  première 
méthode  (270);  procédé  de  calcul  ;  seconde  méthode  de  M.  Bowley  (271) 
application  (272);  méthode  du  professeur  K.  Pearson  ;  exemple  (273); 
inconvénients  de  la  dominante  (274);  références  (275). 


Chapitre  III.  —  La  dispersion  et  ses  mesures. 

[,  Nature  de  la  dispersion.  —  Définition  de  la  dispersion  ;  exemple 
(276);  exemples  d'une  dispersion  étendue,  restreinte;  utilité  des 
mesures  de  la  dispersion  (277)  ;  application  à  la  statistique  des  salaires 
(278)  ;  énumération  des  types  de  mesure  (279). 

II.  Moyenne  de  déviation.  —  Notion  de  la  moyenne  de  déviation 
{for m.  27),  exemples  (280)  ;  application  à  une  série  continue  (281)  ; 
déviation  dans  une  série  à  données  groupées  ;  règle  (282)  ;  calcul  de 
l'intervalle  de  classe;  exemple;  avantages  de  la  moyenne  de  dévia- 
tion (283). 

III.  Déviation-type  {Standard  déviation).  —  Définition  {form.  28),  appli- 

cation à  une  série  continue  ;  exemple  (28i)  ;  expression  basée 
sur  une  autre  valeur  que  M  {form.  29,  30)  application  (285)  ;  autre 
règle  de  calcul  ;  exemple  (286)  ;  rapports  entre  la  moyenne  de 
déviation  et  la  déviation-type  ;  valeur  de  la  constante  0.7979  ;  la 
déviation-type  est  la  meilleure  mesure  de  la  variabilité  ;  usage  pour 
le  calcul  de  la  précision  de  la  moyenne  {form.  Si,  32)  (287). 

IV.  Déviation  interquarlile.  —  Elle  partage  la  série  en  quatre  parties 

{form.  33  à  36)  application  (288);  son  rôle  dans  les  comparaisons  ; 
application  (289)  ;  rapport  avec  la  déviation-type  ;  dans  quels  cas 
ce  rapport  est  exact  (290). 


TABLE   ANA1.YÏTQI  E    DES    M  ATI  EU  ES 


V.  Coefficient  de  variation.  —  Sur  quelle  mesure  se  calcule  le  coefficient 

de  variation  et  dans  quels  cas  (form.  37.  38,  89)  (291):  applications 
diverses  (292  . 

VI.  Dissymétrie  (Skewness).  —  Elle  mesure  l'irrégularité  de  la  disper- 

sion ;  procédés  pour  la  mesurer  (form  40,  41,  42,  43)  ;  mesure  le 
plus  généralement  adoptée  (form.  44);  autres  formules  >  form  f5,  fô 
(295);  exemples  et  applications  (294). 

VII.  Variabilité.  —  Distinction  entre  la  nature  des  phénomènes  considérés 
sous  le  rapport  de  leur  dispersion  ;  des  erreurs  d'observation  (295); 
du  manque  d'homogénéité  (296)  ;  formule  de  la  moyenne  arithmétique 
des  différences  entre  quantités  observées  (form.  17.  4 fi)  (297  )  ;  des- 
cription du  procédé  arithmétique  de  calcul  (298):  application, 
exemple  (299);  utilisation  de  la  médiane  (form..  49,  50)  (300);  for- 
mules à  employer  dans  les  divers  cas  (form.  51,  52);  description  des 
calculs  arithmétiques  (501);  application  à  un  exemple  précédent  (502); 
application  à  des  recherches  anthropométriques  (505)  ;  référen- 
ces (501). 

Chapitre  IV.  —  Covariation  (corrélation). 

I.  Portée  du  coefficient  de  covariation  ;  sphère  d'application;  examen 

critique  général.  —  Procédés  mathématiques  ayant  pour  but  d'ana- 
lyser l'élroitesse  des  rapports  entre  phénomènes:  ils  sont  ('tendus 
aux  faits  économiques  et  sociaux  (305);  critique  de  l'expression 
<c  corrélation  »  (306);  ces  procédés  précisent  le  degré  de  parallélisme 
des  courbes,  orientent  les  réflexions  du  chercheur  et  servent  à 
contrôler  ses  raisonnements  (307);  analyse  des  principaux  travaux 
d'application  (508)  ;  nécessité  d'une  rigoureuse  correction  logique; 
exposé  d'un  problème  spécial  (509);  examen  critique  (510). 

II.  Indice  de  dépendance.  —  Ressemblance  entre  séries;  accord  et  désac- 

cord des  courbes  (511);  méthode  de  comparaison;  description  du 
procédé  (form.  53,  54)  (512);  application  aux  rapports  entre  la  pro- 
duction et  les  échanges  (515);  autres  résultats  (514);  application  aux 
salaires  dans  les  charbonnages  et  leur  relation  avec  le  bénéfice  à  la 
tonne  (315). 

III.  Coefficient  de  dépendance.  —  Différence  avec  l'indice  (form.  55.  56)  ; 

application  à  l'exemple  précédent,  discussion  du  résultat  (316). 
Expression  .1  (form.  57),  sa  signification  (51 7j;  coefficient  K 
(form.  58),  rapports  avec  J,  signification  de  K,  exposé  des  résul- 
tats (518). 

IV.  Coefficient  de  covariation  (r).  —  Covariation  entre  deux  courbes  (319); 

entre  données  d'un  tableau  statistique  (520);  base  mathématique  du 
coefficient  de  covariation  (//(/.  26  et  27)  (521)  ;  comment  se  calculent 
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les  écarts;  Irois  cas  envisagés  {fig  28  et  29)  {for m.  09)  (522)  ;  examen 
du  théorème  initial  (fig.  30)  {form.  60  à  63)  (323);  suite  de  la  démon- 
stration (324);  cas  à  envisager  dans  le  calcul  de  r  (form.  08,  69,  70) 
(525);  exemple  pour  deux  séries  chronologiques;  description  du  calcul 
(326);  second  exemple  (327);  méthode  de  llooker  pour  le  calcul  des 
variations  portant  sur  une  courte  période;  portée  de  cette  méthode; 
étendue  du  temps  à  considérer  dans  la  moyenne  instantanée  (328); 
application  de  la  méthode  de  Ifooker  aux  indices  de  la  production  et 
des  échanges;  conclusions  (329)  :  procédé  quand  il  s'agit  de  séries 
groupées  ;  démonstration  {form.  11  et  12)  (550);  exemple  tiré  de  la 
relation  entre  l'âge  des  époux;  recherche  de  l'intervalle  de  classe  et 
des  Standard  déviations  (331);  arrangement  de  la  table  de  corrélation, 
disposition  des  valeurs  positives  et  négatives  (352)  ;  procédé  pour  le 
calcul  du  total  des  fréquences,  résultat  (535);  les  méthodes  qui  pré- 
cèdent conduisent  seules  à  des  résultats  précis,  exemple  (55-1,  355). 

V.  Equations  de  régression.  —  Elles  constituent  un  procédé  d'investi- 
gation complémentaire  (536);  genèse  des  équations  de  régression 
{form  13  à  78)  (557);  calcul  des  équations  de  régression  (558). 

VI.  Corrélations  à  trois  variables.  —  La  formule  du  coefficient  r  perd  de 
sa  précision  à  mesure  qu'aug'mente  le  nombre  de  causes  reconnues 
(339);  formule  et  notations  diverses  [form.  79)  '540);  données  numé- 
riques de  l'exemple  (541);  recherche  des  constantes  M,  a,,  a2,  a3  et  r 
(542);  détermination  de  la  première  constante  corrélative  (543;  ;  suite 
du  travail  numérique  (5i4);  interprétation  des  résultats  (545';  réfé- 
rences (546) . 


Chapitre  V.  —  Statistique  graphique. 

I.  Définition  et  base  géométrique.  —  liaisons  de  recourir  à  la  statistique 
graphique  (547)  ;  la  statistique  graphique  a  son  rôle  propre,  mais 
elle  ne  peut  se  passer  de  la  statistique  numérique;  son  avenir  (548); 
la  base  de  cette  partie  de  la  statistique  est  la  détermination  d'un 
point  dans  un  plan  {fig.  31)  (549);  données  positives  et  négatives,  leur 
position  dans  ie  graphique;  applications  {fig.  32  et  33)  (550);  mode 
de  représentation  graphique  d'une  équation  du  premier  degré  à  une 
inconnue  (351);  équations  à  deux  inconnues  {fig.  34  et  35)  (552)  ; 
représentation  graphique  du  trinôme  du  second  degré  [fig.  36)  (353); 
fonction  trigonométrique  donnant  naissance  à  la  courbe  sinusoïdale 
(554)  ;  table  des  sinus  de  0  à  90  degrés  (555)  ;  règle  pour  la  construc- 
tion de  la  courbe  {fig.  31)  (556). 

II.  La  statistique  graphique  démons  Ira  line.  —  Divisions  générales  et 
définitions  (557);  A.  Diagrammes;  figures  représentatives;  dia- 
grammes; divisions  (558);   le  point,   la  ligne,   la   surface;  leurs 
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caractéristiques  (559)  ;  lu  statistique  graphique  est  alite,  mais  il  est 
fréquent  de  tomber  ilans  l'excès;  cas  dans  lesquels  son  usage  est 
abusif  (360)  ;  B.  Diagrammes  orthogonaux  ;  diagrammes  de  succès 
sioi»  au  historigramme;  leur  utilité  (."(il  )  ;  application  :  transformation 
des  données  numériques  en  un  hislorigramme  (fig. 38);  avantages 
de  la  figure  sur  les  nombres  (562);  rapport  entre  l'espacement  sur 
l'axe  des  abeisses  et  l'axe  des  ordonnées;  règles  générales  (363); 
procédé  de  M.  J.  Berlillon  (364);  convention  proposée  par  l'Institut 
international  de  statistique  (//'</.  39)  (365);  second  exemple  (366); 
influence  de  la  position  de  la  moyenne  sur  l'allure  de  la  courbe  [367); 
définition  du  diagramme  de  distribution;  différences  entre  les  deux 
espèces  de  diagrammes  (form.  SU)  (368);  le  polygone  de  fréquence  et 
l'histogramme  (369) ;  les  termes  extrêmes  peuvent-ils  être  aégligés? 
règle  du  calcul,  application  (370);  application  aux  courbes  de 
fréquence  des  conventions  admises  en  ee  qui  concerne  les  courbes 
chronologiques  (371);  C.  Courbes  logarithmiques-,  inconvénients, 
au  point  de  vue  de  la  précision,  dfes  diagrammes  orthogonaux;  usage 
des  courbes  logarithmiques  (572);  particularités  des  courbés  loga- 
rithmiques (575);  cas  où  leur  utilité  spéciale  apparaît  surtout  : 
application  [fig.  40);  construction  et  interprétation  de  la  courbe  374); 
courbes  à  double  échelle  logarithmique  (375);  D.  Diagrammes 
polaires  :  fondement  géométrique,  construction,  exemple  (376  ; 
E  Carlogrammes;  définition,  étendue  de  la  définition  .177  ;  cartes 

avec  diagrammes,  leur  usage  (.T)7S)  :  application  spéciale  de  ce  procédé 
(379);  caries  teintées  ;  définition;  nombre  de  divisions  géographique^; 
exposé  du  procédé;  impression  fausse  à  éviter  (580);  observations 
sur  le  nombre  de  teintes  à  employer  (581  i;  cartes  à  bandes;  exposé 
du  procédé  |582  ;  cartes  avec  niveau;  en  quoi  elles  consistent;  leurs 
inconvénients  (585)  ;  autres  ligures  coloriées  non  accompagnées  de 
cartes;  procédés  de  MM.  Foville  et  Henini  584);  stéréogrammes; 
différences  avec  les  diagrammes;  pouvoir  éiendu  de  représentation; 
principes  de  leur  construction  ;  application  (385);  les  stéréogrammes 
sont  d'un  usage  rare  et  peu  pratique  (586). 

III.  Lu  statistique  graphique  comparative.  —  Rôle  des  représentations  gra- 

phiques.sous  le  rapport  comparatif  (587 1;  règles  et  procédés  de  compa- 
rahilité  |588.;  réunion  des  données  proportionnelles  et  absolues  (389); 
comparaison  des  courbes  de  distribution  ;  nécessité  de  l'usage  de- 
nombres  proportionnels  ;  comment  utiliser  en  même  temps  les 
données  absolues  ;  procédé  de  M.  .Mardi  (fig.  41)  (390)  ;  comparaisons 
à  l'aide  de  carlogrammes  ;  procédés  de  M.  (Ibevsson  (391  . 

IV.  La  statistique  graphique  comme  instrument  d'investigation.  — 

Méthode  graphique  des  poufcentiles  de  Sir  i< .  (laiton;  manière  «le 
tracer  la  courbe  de  Galton  ;  application  ;  interprétation  [fig.  42)  (59"2); 
méthode  graphique  pour  la  recherche  de  la  médiane  de  M.  Yule  ; 
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description  du  procédé  (395)  ;  méthode  graphique  pour  la  recherche 
du  degré  de  la  corrélation,  de  Sir  F.  Galton  :  description  du  procédé 
(394);  références  (395). 


LIVRE  III 

La  loi  des  erreurs. 

I    —  Définitions  et  généralités 

L'erreur  mathématique  ;  différence  avec  l'erreur  philosophique  ;  noms  sous 
lesquels  la  loi  des  erreurs  est  désignée  (596);  comment  se  justifie 
l'emploi  de  l'expression  «  loi  des  erreurs  »  ;  opinion  de  Bertrand  ; 
erreurs  systématiques  et  erreurs  accidentelles;  division  des  erreurs 
systématiques;  elles  sont  exclues  des  probabilités;  la  répartition 
systématique  des  erreurs  accidentelles  prouvée  par  l'expérience; 
exemples  de  Bessel  et  de  Quetelet;  les  erreurs  se  calculent  par 
rapport  à  la  moyenne  (397)  ;  la  moyenne  est  la  valeur  la  plus 
exacte;  démonstration  (form.  81-82)  (598):  le  calcul  des  probabilités 
peut  être  étendu  à  d'autres  matières  que  celles  dépendant  du  hasard; 
la  distribution  de  certains  phénomènes  ressemble  à  celle  résultant 
du  hasard;  exemple;  il  s'agit  d'un  rapprochement,  non  d'une  simi- 
litude ;  en  quoi  il  convient  d'éviter  tout*;  exagération  (599). 

11.  —  Notions  sur  les  probabilités. 

Définition  de  la  probabilité;  le  calcul  des  combinaisons  sert  à  déterminer 
le  nombre  de  cas  également  possibles  (400);  différence  entre  la 
probabilité  a  priori  et  la  probabilité  it  posteriori;  rôle  de  la 
statistique  pour  fixer  la  probabilité  a  posteriori  (401);  la  proba- 
bilité calculée  sur  un  grand  nombre  de  cas  ne  se  vérifie  pas  pour 
chaque  cas  particulier;  différence  entre  la  probabilité  et  la  fré- 
quence; notion  de  l'écart  (402);  règle  de  la  fixation  des  écarts; 
vérification  expérimentale  par  Quetelet;  l'expérience  ne  peut  suffire, 
il  faut  recourir  à  la  théorie;  théorème  de  Bernouilli;  caractères 
essentiels  de  cette  proposition  (405)  :  intervention  des  combinaisons; 
les  calculs  sont  excessivement  longs  (form.  83)  (404;;  formule 
simplificative  de  Stirling  (form.  84  et  85)  ;  l'erreur  relative  de  la  for- 
mule est  très  réduite  (405);  table  de  probabilité  des  écarts  d'après  la 
formule  réduite,  la  table  numérique  peut  se  traduire  en  graphique  ; 
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règle  de  l'écart-étalon  (form.  #6^(406);  application  de  la  statistique; 
la  loi  des  phénomènes  exprimée  par  la  statistique  est-elle  conforme 
à  la  loi  du  hasard?  un  grand  nombre  de  phénomènes  échappent  à 
cette  conformité;  exemple  des  statistiques  judiciaires  (407);  compa- 
raison des  résultais  de  l'expérience  avec  les  données  de  la  théorie; 
application  à  un  problème  concret;  recherche  des  écarts  et  de  leur 
classement  (408);  recherche  de  la  distribution  théorique  des  écarts; 
calcul  de  l'écart  étalon  {form.  86)  exemple  numérique  (409);  forma- 
tion du  tableau  de  distribution  (410);  comparaison  entre  la  courbe 
théorique  et  la  courbe  représentative  des  écarts  observes  fia.  43) 
(414)  ;  mesure  de  l'écart;  interprétation  du  résultat  412). 

III.  —  La  loi  des  erreurs. 

Aucune  mesure  n'est  parfaite;  raisons  de  cette  imperfection;  les  erreurs 
faibles  sont  plus  nombreuses  que  les  autres;  probabilité  égale  des 
erreurs  positives  et  négatives  (413);  rappel  de  la  notion  de  moyenne; 
exposé  de  la  formule  de  la  loi  des  erreurs  {form.  87  à  97)  (114); 
représentation  graphique  de  la  courbe  normale  des  erreurs;  particu- 
larités de  cette  courbe  (415  ;  table  numérique  pour  la  comparaison 
de  la  distribution  théorique  avec  la  distribution  observée;  manière 
d'utiliser  celte  table  (416);  méthode  de  (i.  H.  Davenport  ;  application 
numérique;  table  des  ordonnées  de  la  courbe  normale  i  -417)  ; 
appareil  de  Gallon  (418)  ;  appareil  île  Pearson  (419). 

IV   —  Les  types  de  distribution  dérivée. 

Cas  de  déviation  de  la  courbe  des  observations  (420;;  division  des  courbes 
unimodales  d'après  Pearson  {form.  98  à  102  (421);  détermination  du 
type  auquel  se  rattache  une  courbe  (form.  103  à  105);  application 
numérique;  détermination  des  moments  autour  de  la  moyenne 
{form.  lOd  a  III)  (422);  méthode  de  M.  Hardy  {form.  112)  (423); 
suite  des  calculs  dans  le  cas  d'une  moyenne  calculée  :  1°  par  le 
procédé  ordinaire,  2°  par  la  méthode  indirecte;  application  form.  1 13- 
115)  (424)  ;  fonction  critique  de  Pearson  pour  les  polygones  de 
fréquence;  application  (form  116)  (425)  :'  méthode  pour  la  compa- 
raison du  polygone  observé  avec  le  polygone  théorique  (form.  117) 
(426);  méthode  pour  les  variables  groupées  'form.  118  h  122)  (427)  ; 
valeur  de  la  fonction  critique  (428). 

V.  —  Quelques  déterminations  d'erreurs  probables. 

Erreur  probable  de  la  moyenne  (form  28  el  123)  (429)  ;  erreur  probable 
de  la  médiane  {form.  124)  (430);  erreur  probable  de  la  standard 
déviation  {form.  125-120)  (431);  erreur  probable  du  coeflicienl  de 
covarialion  {form.  127)  (432);  erreur  probable  du  coeflicienl  de 
régression  {form.  128-129)  (433)  ;  références  (434). 
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411. 
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134,  150  (note),  151,  160,  170,  184, 
364,  395,  420  (note). 
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Bertrand.  —  Paragraphes  397,  407  (note). 

Billeter.  —  Paragraphe  180. 

Block.  —  Paragraphes  61,  131,  137  (note), 
162,  184,  275. 

Blodgett.  —  Paragraphes  102,  134. 

Bodio.  —  Paragraphes  51,  56. 

Boetius.  —  Paragraphe  220 

Boole.  —  Paragraphe  141. 
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46,  40,  61,  399,  403,  405  (noie),  406 
(note),  413  (note),  434. 

Borinage.  —  Paragraphe  79. 
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Boston.  —  Paragraphe  89  (note). 

Botero  (Giovanni).  —  Paragraphe  11. 
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272,  273,  275,  304,  305  (note)j  319 
(note),  372,  373,4.34. 

Brabant.  —  Paragraphes  19,  198. 

Bradley.  —  Paragraphe  397. 

Bravais.  —  Paragraphe  305, 

Bresciani.  —  Paragraphes  305  (note)',  319 
(note). 

Breslau.  -  Paragraphe  15. 
Brinton  W.  C.  -  Paragraphe  395. 
British  Association.  —  Paragraphes  203, 
399. 

Brunsviga  (Machines  à  calculer).  —  Para- 
graphe 179. 

Bruxeiles.  —  Paragraphes  18,  22,  80,  139. 
259. 

Buckle.  —  Paragraphe  31. 

Bureau  of  Labor  Statistics  (Etats-Unis):  - 

Paragraphe  226  (note). 
Burroughs.  —  Paragraphe  177. 
Bussching  (Ant.  B.).  —  Paragraphes  17, 

18. 

Caisse  générale  d'épargne  et  de  retraite  de 
Belgique.  —  Paragraphe  374. 

Carvallo(E). —  Paragraphes  391  (môte),402; 
404  (note),  405(nole),  406, 408,409(note), 
434. 

Census  (Reports  o!  the  Departmeul  of 
Commerce  and  Labor  Bureau  of  the) 
(Washington).  —  Paragraphes  134.  159 
(note). 

Centre  (Belgique).  —  Paragraphe  79. 
Charleroi.  —  Paragraphe19, 
Cheysson. —  Paragraphes  loi.  168;  184, 
378,  382,  391,  395. 

Chine.  —  Paragraphe  10. 

Colajanni.  —  Paragraphe  01,  102,  275. 
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